https://www.aitimes.com/news/articleView.html?idxno=159008
마크 저커버그 메타 CEO가 빅테크 기업의 인공지능(AI) 훈련용 데이터 경쟁에 대해 중요한 것은 데이터를 확보하는 것뿐 아니라 이를 최대한 잘 활용하는 것이 중요하다고 밝혔다. 이를 ‘피드백 루프(feedback loops)’라고 명명했다.
비즈니스 인사이더는 21일(현지시간) 자커버그 CEO가 기술 산업 뉴스레터 커맨드 라인과의 인터뷰에서 “중요한 것은 사전 학습 데이터보다 피드백 루프"라고 말했다고 전했다.
피드백 루프는 이전 출력을 기반으로 AI 모델을 점차 재훈련하고 개선하는 것을 말한다. 예를 들어 알고리즘은 AI 모델이 오류를 냈을 때 이를 알려주고 조정할 수 있는 데이터를 제공한다.
저커버그 CEO는 "많은 사람들이 사용 행태를 관찰하고 이를 통해 개선할 수 있다면 시간이 지날수록 AI 모델은 더욱 차별화될 것"이라고 설명했다.
오픈AI, 구글, 아마존, 메타 등 빅테크 기업들은 강력한 AI 모델을 만들기 위한 훈련용 데이터가 부족하다는 문제를 안고 있다. 그러나 저커버그 CEO는 데이터를 늘리는 것보다 기존 데이터를 정교하게 만드는 것이 중요하다고 강조한 것이다.
또 데이터 부족 현상에 대한 또다른 해결책으로 '합성 데이터'를 지목했다.
합성 데이터는 실제 사건에서 생성된 데이터를 모방하도록 인위적으로 생성한 데이터를 말한다. 이를 통해 다양한 문제에 대한 모델을 시험하고 효과적인 경로를 확인하는 데 사용할 수 있다는 설명이다.
챗봇 '클로드'를 제작한 앤트로픽도 내부적으로 생성된 데이터를 모델 학습에 사용했다고 밝혔다. 오픈AI도 이를 고려하고 있지만 샘 알트만 CEO는 지난 5월 컨퍼런스에서 "좋은 합성 데이터를 만들 수 있을 만큼 스마트한 모델을 갖추는 것이 핵심”이라고 말했다.
한편 저커버그는 피드백 루프에 온전히 의존하는 것에 대해서는 경계해야 한다고 지적했다. AI가 초기부터 '좋은 데이터'로 학습하지 않을 경우 편견, 오류, 실수 등이 강화될 수 있다는 설명이다.
또 합성 데이터의 학습 비중이 늘어나면 모델 자체가 붕괴한다는 사실도 지적된 바 있다.
댓글 영역
획득법
① NFT 발행
작성한 게시물을 NFT로 발행하면 일주일 동안 사용할 수 있습니다. (최초 1회)
② NFT 구매
다른 이용자의 NFT를 구매하면 한 달 동안 사용할 수 있습니다. (구매 시마다 갱신)
사용법
디시콘에서지갑연결시 바로 사용 가능합니다.