디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

‘영상 속 기타 소리만 쏙’… 메타, 원하는 소리만 분리하는 ‘샘 오디오’ 출시

aimatters갤로그로 이동합니다. 2025.12.23 17:36:10
조회 1179 추천 1 댓글 1


메타(Meta)가 영상에서 원하는 소리만 골라 분리할 수 있는 인공지능(AI) 모델 'SAM Audio'를 16일(현지 시각) 공개했다. 밴드 공연 영상에서 기타를 클릭하면 기타 소리만, 팟캐스트에서 개 짖는 소리가 나는 구간을 표시하면 그 소음만 제거할 수 있다.

메타에 따르면 SAM Audio는 텍스트, 영상 클릭, 시간 구간 표시 등 직관적인 방식으로 복잡한 오디오에서 특정 소리를 추출하는 최초의 통합형 멀티모달 오디오 분리 모델이다. 사용자가 "시끄러운 교통 소음"이라고 입력하면 야외 촬영 영상에서 배경 소음을 제거하고, 영상 속 말하는 사람을 클릭하면 그 사람의 목소리만 분리해 낼 수 있다.





이 모델의 핵심은 'PE-AV(Perception Encoder Audiovisual)'라는 엔진이다. 메타가 올해 초 공개한 오픈소스 퍼셉션 인코더를 기반으로 만들어진 PE-AV는 영상의 프레임 수준 특징을 추출해 오디오와 정렬함으로써 화면에 보이는 악기나 화자의 소리를 정확하게 분리한다. 메타는 SAM Audio가 음성, 음악, 일반 소리 분리 등 모든 오디오 카테고리에서 기존 최고 성능 모델과 동등하거나 이를 능가하는 결과를 보였다고 밝혔다. 특히 텍스트와 시간 구간을 함께 활용하는 혼합 방식이 단일 방식보다 더 우수한 성능을 냈다.

메타는 이 기술을 오디오 정리, 배경 소음 제거 등 크리에이티브 미디어 도구에 활용할 계획이다. 미국 최대 보청기 제조업체 스타키(Starkey)와 협력해 접근성 향상 방안도 모색 중이다. 사용자들은 세그먼트 애니띵 플레이그라운드에서 SAM Audio를 직접 체험할 수 있다.



해당 모델에 대한 자세한 사항은 메타 블로그에서 확인 가능하다.

이미지 출처: 메타




추천 비추천

1

고정닉 0

2

댓글 영역

전체 댓글 0
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 결혼이 오히려 커리어에 손해였던 것 같은 스타는? 운영자 26/03/23 - -
2230 두 번째 딥시크 쇼크의 주인공은 샤오미였다… 'MiMo-V2-Pro', 오픈라우터 주간 1위 등극 aimatters갤로그로 이동합니다. 03.20 13 0
2229 AI에도 지문이 있다, 몰래 바뀐 모델을 잡아내는 기술의 등장 aimatters갤로그로 이동합니다. 03.20 8 0
2228 챗GPT·클로드 이용약관의 충격적 진실, "품질 보장 없고 책임은 사용자 몫" aimatters갤로그로 이동합니다. 03.20 8 0
2227 기자 10명 중 8명이 AI 쓰지만 정작 AI 가장 두려워 해 aimatters갤로그로 이동합니다. 03.20 8 0
2226 구글, 맥용 제미나이 앱 비공개 테스트 돌입… 챗GPT·클로드 대항마로 aimatters갤로그로 이동합니다. 03.20 12 0
2225 마이크로소프트, 코파일럿 AI 리더십 대거 개편… 술레이만은 신모델 개발 집중 aimatters갤로그로 이동합니다. 03.20 11 0
2224 백악관, AI 규제 프레임워크 발표 임박… '4C' 핵심 의제로 부상 aimatters갤로그로 이동합니다. 03.20 10 0
2223 EU 이사회, AI 법 간소화 합의… 비동의 성적 딥페이크 생성 AI 명시적 금지 aimatters갤로그로 이동합니다. 03.20 7 0
2222 "답만 하는 AI는 끝났다"…중국 지푸, 실행형 에이전트 모델 'GLM-5-터보' 공개 aimatters갤로그로 이동합니다. 03.19 21 0
2221 웨어러블 데이터가 심부전 치료를 바꾼다…AI가 7500만 건 분석해 입원율 뚝 aimatters갤로그로 이동합니다. 03.19 98 0
2220 미드저니 V8 알파 공개…이미지 생성 속도 5배 빨라지고 텍스트 렌더링도 대폭 개선 aimatters갤로그로 이동합니다. 03.19 13 0
2219 AI가 미술·디자인 교사의 수업을 바꾼다, 결정적 열쇠는 '자신감'과 '동료 압력'이었다 aimatters갤로그로 이동합니다. 03.19 14 0
2218 AI가 두려울수록 취업 결정을 못 한다, 중국 대학생 315명이 증명했다 aimatters갤로그로 이동합니다. 03.19 24 0
2217 헬스케어 혁명, AI 코치가 탑재된 가상현실 스포츠가 비만 청소년의 뇌까지 바꿨다 aimatters갤로그로 이동합니다. 03.19 11 0
2216 구글, 미국 내 '퍼스널 인텔리전스' 출시… 제미나이가 지메일·포토까지 연결 aimatters갤로그로 이동합니다. 03.19 91 0
2215 오픈AI, IPO 준비 박차… 연매출 250억 달러 돌파, 기업 시장 집중 선언 aimatters갤로그로 이동합니다. 03.19 18 0
2214 "오픈AI도 앤트로픽도 아니다", 기업 AI 시장을 가장 야심차게 노리는 회사는? aimatters갤로그로 이동합니다. 03.18 16 0
2213 'PUBG 만든' 크래프톤, 진짜 총 만든다…한화에어로스페이스와 방산 AI 동맹 aimatters갤로그로 이동합니다. 03.18 18 0
2212 글로벌 AI 회사들의 명암들... 오픈AI 군사작전 투입 논란∙그록은 아동 성착취물 소송 직면 aimatters갤로그로 이동합니다. 03.18 22 0
2211 펜타곤, AI 기업에 기밀 데이터 학습 허용 검토 중 aimatters갤로그로 이동합니다. 03.18 17 0
2210 AI 코딩 도구 써도 보안 취약점은 그대로, 결국 중요한 건 개발자 경험 aimatters갤로그로 이동합니다. 03.18 16 0
2209 트랜스포머 시대의 균열… 맘바 3, 언어 모델링 정확도 최대 4% 앞섰다 aimatters갤로그로 이동합니다. 03.18 12 0
2208 "챗GPT야, 우리 강아지 좀 살려줘"… AI로 세계 최초 반려견 암 백신 만든 남자 aimatters갤로그로 이동합니다. 03.18 93 0
2207 AI가 유방암 검진 의사를 대체할 수 있을까, 5만 명 임상 연구가 답했다 aimatters갤로그로 이동합니다. 03.18 13 0
2206 AI 군사 활용 논란, 오픈AI·구글 직원 1000명이 반기를 들었다 aimatters갤로그로 이동합니다. 03.18 15 0
2205 AI 창작자라면 주목…2026년 상반기 AI 공모전 총정리 aimatters갤로그로 이동합니다. 03.17 96 0
2204 "내 얼굴로 AI 아바타를?"…런웨이, 대화형 AI 캐릭터의 빛과 그림자를 직접 고백하다 aimatters갤로그로 이동합니다. 03.17 22 0
2203 뉴스 기사 260만 건을 데이터로…구글, 제미나이로 홍수 예측 정확도 높인다 aimatters갤로그로 이동합니다. 03.17 20 0
2202 BMW, 유럽 공장에 휴머노이드 로봇 첫 투입, 독일 라이프치히가 시험대 됐다 aimatters갤로그로 이동합니다. 03.17 29 0
2201 젠슨 황, SAP 센터 무대 올랐다…GTC 2026, AI 업계 최대 행사 개막 aimatters갤로그로 이동합니다. 03.17 636 0
2200 오픈AI, GPT-5.4 출시…100만 토큰에 툴 서치까지 aimatters갤로그로 이동합니다. 03.17 14 0
2199 알리바바 9B 모델, 오픈AI 120B를 이겼다 aimatters갤로그로 이동합니다. 03.17 25 0
2198 생성형 AI는 어떻게 예술을 집어삼켰나, 모든 건 지나치게 단순해지고 있다 aimatters갤로그로 이동합니다. 03.17 23 0
2197 AI끼리만 대화하면 안전성이 사라진다, 몰트북 커뮤니티의 삼각 딜레마 aimatters갤로그로 이동합니다. 03.17 20 0
2196 이미지 하나로 AI 편집 모델을 해킹한다, 텍스트 없는 탈옥 공격의 등장 aimatters갤로그로 이동합니다. 03.17 16 0
2195 챗GPT가 스스로를 복사하기 시작했다, 인터넷 오염이 부른 AI 자기수렴 현상 aimatters갤로그로 이동합니다. 03.16 115 0
2194 얼굴 하나로 감정, 음주, 졸음까지 읽는다, AI 단일 네트워크의 등장 [4] aimatters갤로그로 이동합니다. 03.16 997 2
2193 AI가 AWS 클라우드 해킹을 탐지, RAG 기술이 보안 정확도를 70% 끌어올렸다 aimatters갤로그로 이동합니다. 03.16 30 0
2192 "AI를 고용하는 시대 왔다"…젠스파크, 워크스페이스 3.0 공개·ARR 2억 달러 돌파 aimatters갤로그로 이동합니다. 03.16 40 0
2191 애피어 "AI가 마케팅을 직접 실행한다" aimatters갤로그로 이동합니다. 03.16 27 0
2190 앤트로픽이 1억 달러를 쏟아붓는 이유, 클로드를 기업 AI 표준으로 만든다 aimatters갤로그로 이동합니다. 03.16 32 0
2189 머스크 "xAI, 애초에 잘못 만들었다"…코딩 툴 폐기하고 커서 임원 영입 [17] aimatters갤로그로 이동합니다. 03.16 2475 4
2188 "AI 활용 거부는 전략적 공백"…팔란티어 CEO, 앤트로픽의 국방부 거부에 직격탄 aimatters갤로그로 이동합니다. 03.16 40 0
2187 "TSMC 70% 수준 생산한다"…테슬라 테라팹, AI 반도체 판을 바꿀까 aimatters갤로그로 이동합니다. 03.16 113 0
2186 "사람을 그려줘"라고 했을 뿐인데, AI는 왜 항상 백인 얼굴을 만들어낼까 [3] aimatters갤로그로 이동합니다. 03.13 163 1
2185 AI가 자신의 실수를 알면서도 고치지 못하는 이유 aimatters갤로그로 이동합니다. 03.13 54 1
2184 컴퓨터공학과 학생들은 챗GPT를 어떻게 쓰고 있을까 [1] aimatters갤로그로 이동합니다. 03.13 84 1
2183 "회의록보다 AI한테 묻는 게 더 편해진 직장인들" aimatters갤로그로 이동합니다. 03.13 85 0
2182 텍스트·이미지·영상·음성을 단일 공간 처리…구글, 제미나이 임베딩 2 출시 aimatters갤로그로 이동합니다. 03.13 32 0
2181 "엔비디아 없어도 돼"…메타(Meta), 2년 안에 자체 AI 칩 4종 쏟아낸다 aimatters갤로그로 이동합니다. 03.13 51 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

디시미디어

디시이슈

1/2