갤러리 이슈박스, 최근방문 갤러리
개념글 리스트
1/3
- 군검찰, 채상병 사건 '이첩 보류 지시자'로 정종범 추가 희망22
- 안싱글벙글 대한민국 모쏠 근황 김희망이
- 뒤늦게 쓰는 섬진강 종주 후기 아이돌★영범
- 백종원이 슈퍼마켓하는 만화 카라데키드
- 스위치 2 사양 나왔나보네요 clearlife
'돈 내면 성능평가 1위?'…'벤치마크 무용론'에 자금논란까지
AI 성능 평가의 허와 실• 오픈AI, 메타, xAI 등 빅테크 기업들이 자사 AI 모델의 벤치마크 점수를 부풀리기 위해 맞춤형 사전 훈련이나 특수 테스트 버전을 사용하는 등의 의혹이 제기되고 있다.• 메타의 라마4, 머스크의 그록3, 오픈AI의 GPT-3 등이 벤치마크 조건에 맞춰 훈련된 모델을 사용하여 실제 성능보다 높은 점수를 기록한 사례가 드러났다.• 스탠퍼드대 HAI 연구소는 벤치마크 발표 사례 150개 이상을 검토한 결과 데이터 조건 통제 및 재현성 문제를 지적하며 벤치마크의 신뢰성에 의문을 제기했다.• 벤치마크 기관에 대한 빅테크 기업들의 자금 지원으로 인해 평가 결과에 대한 공정성 논란이 일고 있으며, 현재 AI 성능 평가 방식은 마케팅 도구에 가깝다는 비판이 제기되고 있다.https://n.news.naver.com/mnews/article/421/0008236494
작성자 : ㅇㅇ고정닉
댓글 영역
획득법
① NFT 발행
작성한 게시물을 NFT로 발행하면 일주일 동안 사용할 수 있습니다. (최초 1회)
② NFT 구매
다른 이용자의 NFT를 구매하면 한 달 동안 사용할 수 있습니다. (구매 시마다 갱신)
사용법
디시콘에서지갑연결시 바로 사용 가능합니다.