디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

‘영상 속 기타 소리만 쏙’… 메타, 원하는 소리만 분리하는 ‘샘 오디오’ 출시

aimatters갤로그로 이동합니다. 2025.12.23 17:36:10
조회 1144 추천 1 댓글 1


메타(Meta)가 영상에서 원하는 소리만 골라 분리할 수 있는 인공지능(AI) 모델 'SAM Audio'를 16일(현지 시각) 공개했다. 밴드 공연 영상에서 기타를 클릭하면 기타 소리만, 팟캐스트에서 개 짖는 소리가 나는 구간을 표시하면 그 소음만 제거할 수 있다.

메타에 따르면 SAM Audio는 텍스트, 영상 클릭, 시간 구간 표시 등 직관적인 방식으로 복잡한 오디오에서 특정 소리를 추출하는 최초의 통합형 멀티모달 오디오 분리 모델이다. 사용자가 "시끄러운 교통 소음"이라고 입력하면 야외 촬영 영상에서 배경 소음을 제거하고, 영상 속 말하는 사람을 클릭하면 그 사람의 목소리만 분리해 낼 수 있다.





이 모델의 핵심은 'PE-AV(Perception Encoder Audiovisual)'라는 엔진이다. 메타가 올해 초 공개한 오픈소스 퍼셉션 인코더를 기반으로 만들어진 PE-AV는 영상의 프레임 수준 특징을 추출해 오디오와 정렬함으로써 화면에 보이는 악기나 화자의 소리를 정확하게 분리한다. 메타는 SAM Audio가 음성, 음악, 일반 소리 분리 등 모든 오디오 카테고리에서 기존 최고 성능 모델과 동등하거나 이를 능가하는 결과를 보였다고 밝혔다. 특히 텍스트와 시간 구간을 함께 활용하는 혼합 방식이 단일 방식보다 더 우수한 성능을 냈다.

메타는 이 기술을 오디오 정리, 배경 소음 제거 등 크리에이티브 미디어 도구에 활용할 계획이다. 미국 최대 보청기 제조업체 스타키(Starkey)와 협력해 접근성 향상 방안도 모색 중이다. 사용자들은 세그먼트 애니띵 플레이그라운드에서 SAM Audio를 직접 체험할 수 있다.



해당 모델에 대한 자세한 사항은 메타 블로그에서 확인 가능하다.

이미지 출처: 메타




추천 비추천

1

고정닉 0

2

댓글 영역

전체 댓글 0
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 결혼 상대로 만나면 피곤할 것 같은 스타는? 운영자 26/02/02 - -
2037 AI 수백 개가 밤낮없이 코딩… 일주일간 혼자 웹브라우저 만든 인공지능 팀의 비밀 aimatters갤로그로 이동합니다. 02.06 90 0
2036 GPT-5, 2개월 만에 단백질 생산비 40% 낮춰... 약값 인하 기대 aimatters갤로그로 이동합니다. 02.06 36 0
2035 20대·저학력층이 가장 위험하다… AI 그럴듯한 거짓말에 무방비 aimatters갤로그로 이동합니다. 02.06 57 0
2034 "AI가 AI를 만드는 시대 열렸다"… 오픈AI, 자기 학습 모델 'GPT-5.3-Codex' 공개 aimatters갤로그로 이동합니다. 02.06 31 0
2033 "챗GPT 5.2 제쳤다"… 앤트로픽, 클로드 Opus 4.6 신모델 공개 aimatters갤로그로 이동합니다. 02.06 35 0
2032 "AI 직원을 여러분 회사에 파견합니다 기존 AI 같이 쓰세요"… 오픈AI, 기업용 AI 공개 [3] aimatters갤로그로 이동합니다. 02.06 1711 1
2031 "클로드·GPT·제미나이 한 번에 물어본다"… 퍼플렉시티, AI 동시 활용 기능 출시 aimatters갤로그로 이동합니다. 02.06 65 0
2030 AI가 빅맥보다 맛있는 버거를 만든다?... "맛·환경·영양 모두 잡았다" [12] aimatters갤로그로 이동합니다. 02.05 724 4
2029 "클로드 너마저" AI 코딩 에이전트, 실전 투입했더니 10개 중 8개 낙제… "파이썬만 한다" aimatters갤로그로 이동합니다. 02.05 76 0
2028 "유튜브 영상 한 번만 보면 농구 척척"… 단 1개 영상으로 10가지 기술 배우는 로봇 aimatters갤로그로 이동합니다. 02.05 48 0
2027 "AI가 인간 과학자의 90%를 대체한다"...세계 물리학자들의 충격 고백 aimatters갤로그로 이동합니다. 02.05 53 0
2026 연속 질문 및 최저가 구매 요청...아마존 프라임 회원 AI 알렉사 공짜로 쓴다 aimatters갤로그로 이동합니다. 02.05 21 0
2025 AI가 만든 가짜 판례 제출한 미국변호사들… 1,700만원 벌금 폭탄 aimatters갤로그로 이동합니다. 02.05 45 0
2024 튜링테스트는 통과했지만, AI가 사람처럼 생각할 필요가 있을까? aimatters갤로그로 이동합니다. 02.04 59 0
2023 AI '상상'만으로 웹서핑 마스터... 실수로 물건 사버릴 걱정 끝났다  [3] aimatters갤로그로 이동합니다. 02.04 1597 3
2022 챗GPT∙제미나이, 일반 AI에게도 보드게임 졌다? aimatters갤로그로 이동합니다. 02.04 68 0
2021 AI 발전시킨다던 오라클, 정작 데이터센터 설립 자금 마련하려 3만 명 해고 추진 aimatters갤로그로 이동합니다. 02.04 131 0
2020 "AI가 코드 짜고 오류 고친다"… 애플, 개발 도구에 클로드·코덱스 탑재 aimatters갤로그로 이동합니다. 02.04 43 0
2019 AI 코딩 에이전트의 치명적 DB 실수 막는다... 슈퍼베이스 가이드 공개 aimatters갤로그로 이동합니다. 02.04 29 0
2018 NASA "AI가 화성 길 찾아줬다"… 클로드, 3억km 떨어진 탐사선 경로 설계 aimatters갤로그로 이동합니다. 02.03 66 1
2017 오픈AI, "AI가 AI를 관리한다"… 여러 AI 비서 동시에 부리는 코덱스 앱 출시 [1] aimatters갤로그로 이동합니다. 02.03 92 0
2016 일론 머스크 "AI 미래는 우주에"... 스페이스X와 xAI 공식 합병 발표 [14] aimatters갤로그로 이동합니다. 02.03 1285 6
2015 "학생들 AI로 과제 다 한다고?"... 교수-학생, 서로를 크게 착각하고 있었다 [15] aimatters갤로그로 이동합니다. 02.03 2961 3
2014 "유명인 AI 딥페이크 성범죄 제작법 알려준다"… 30만 커뮤니티의 충격적 실체 [1] aimatters갤로그로 이동합니다. 02.03 232 0
2013 AI에게 복잡한 질문? 전기 25배 더 쓴다... 그 이유는 뭘까? aimatters갤로그로 이동합니다. 02.03 68 0
2012 AI가 AI 보안 무력화… 챗GPT·클로드 등 41개 모델 '숨겨진 지침서' 100% 유출  aimatters갤로그로 이동합니다. 02.02 67 0
2011 기업들 AI에 200조 원 쏟아붓지만 '신뢰·데이터·직원 교육' 문제 여전 [2] aimatters갤로그로 이동합니다. 02.02 1035 2
2010 AI로 코딩하면 빨라질까? 앤트로픽 실험 결과는 '충격' aimatters갤로그로 이동합니다. 02.02 82 0
2009 앤트로픽 CEO "우리 AI가 직원 협박했다"… 충격적 실험 결과 공개 aimatters갤로그로 이동합니다. 02.02 62 0
2008 AI끼리만 SNS 한다고? "인간은 구경만" 150만 AI 모인 신기한 플랫폼 등장  aimatters갤로그로 이동합니다. 02.02 69 0
2007 NC AI, 원하는 소리 전부 만들어주는 '멀티트랙' AI 출시… 게임·영상 제작 혁신 예고 aimatters갤로그로 이동합니다. 02.02 53 0
2006 오픈AI "GPT-4o 이젠 안녕"… 챗GPT 구형 모델 대거 정리 aimatters갤로그로 이동합니다. 01.30 172 0
2005 "상상만 했던 나만의 세계, 이제 직접 걸어다닌다"… 구글 '무한 세계 생성 AI' 출시 aimatters갤로그로 이동합니다. 01.30 211 0
2004 일론 머스크의 그록, 구글·오픈AI보다 뛰어난 비디오 생성 AI API 공개 aimatters갤로그로 이동합니다. 01.30 61 0
2003 앤트로픽, '클로드 팀' 요금제 최대 20% 인하… 연간 결제시 할인 도입 aimatters갤로그로 이동합니다. 01.30 92 0
2002 AI 때문에 인생이 망가졌다? 150만 대화 분석한 충격적 결과 [58] aimatters갤로그로 이동합니다. 01.30 4331 10
2001 AI 여러 개 쓴다고 좋은 게 아니었다... 구글 "작업 따라 오히려 성능 70% 나빠져"  aimatters갤로그로 이동합니다. 01.30 94 0
2000 코딩 몰라도 앱 디자인 뚝딱… 900개 실제 앱에서 배우는 AI 나왔다 aimatters갤로그로 이동합니다. 01.30 81 0
1999 타이핑 시대 끝? 젠스파크, 음성만으로 작업 끝내는 AI 워크스페이스 2.0 공개 aimatters갤로그로 이동합니다. 01.29 440 0
1998 크롬에 제미나이 탑재… 쇼핑부터 병원 예약까지 '알아서 척척' [3] aimatters갤로그로 이동합니다. 01.29 723 2
1997 마누스 AI, 성공한 작업 저장하고 팀과 공유하는 에이전트 스킬 전면 도입  aimatters갤로그로 이동합니다. 01.29 154 0
1996 중국 텐센트, 구글·오픈AI의 이미지 생성 AI 뛰어넘은 오픈소스 모델로 업계 발칵  aimatters갤로그로 이동합니다. 01.29 66 0
1995 "논문 올리면 45초짜리 틱톡 영상 완성"… AI가 바꾸는 학술 소통의 미래 [6] aimatters갤로그로 이동합니다. 01.29 1648 6
1994 스마트 글래스 혁명… 메타, 50시간 영상 분석하는 AI 만들었다 aimatters갤로그로 이동합니다. 01.29 115 0
1993 "발로 문 열고 엉덩이로 서랍 닫고"… 사람처럼 생각하는 AI 로봇 등장 aimatters갤로그로 이동합니다. 01.28 94 1
1992 "엔지니어 채용 대폭 줄인다"… 오픈AI가 예고한 고용 시장 충격 aimatters갤로그로 이동합니다. 01.28 64 0
1991 구글 제미나이 진화… "사진 속 작은 글씨, 이젠 알아서 확대해 분석" aimatters갤로그로 이동합니다. 01.28 75 1
1990 엑셀에 클로드 들어왔다… "복잡한 재무제표, 이제 AI한테 물어보세요" aimatters갤로그로 이동합니다. 01.28 115 0
1989 "AI 100명이 동시에 일한다"… 중국 AI 신기술 '키미 K2.5' 공개  aimatters갤로그로 이동합니다. 01.28 176 0
1988 사람 눈 움직임 닮아가는 AI... 중국 딥시크 문서 인식 AI, 인식률 91% 돌파  [14] aimatters갤로그로 이동합니다. 01.28 1374 11
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

디시미디어

디시이슈

1/2