AI '상상'만으로 웹서핑 마스터... 실수로 물건 사버릴 걱정 끝났다

aimatters · 2026.02.04 14:35:34

실제 인터넷에 접속하지 않고 가상으로만 연습한 AI가 진짜 웹사이트를 탐색하는 능력에서 기존 방식을 크게 앞질렀다. 해당 논문에 따르면, 토론토대학교(University of Toronto)와 AI 스타트업 그라디언트(Gradient)가 공동 개발한 '다이나웹(DynaWeb)'은 마치 사람이 머릿속으로 시뮬레이션하듯 AI가 상상만으로 웹 탐색을 배울 수 있음을 증명했다. 이 기술은 AI를 훈련시킬 때 발생하는 높은 비용과 위험을 획기적으로 줄일 수 있는 대안으로 주목받고 있다.

실수로 물건 사고, 계정 바꾸는 AI 훈련의 위험성

AI 웹 비서를 실제 인터넷 환경에서 학습시키는 것은 여러 심각한 문제를 일으킨다. 학습 중인 AI가 실수로 온라인 쇼핑몰에서 물건을 구매하거나, 중요한 계정 설정을 마음대로 바꾸는 등 되돌릴 수 없는 일을 저지를 수 있기 때문이다. 또한 AI가 제대로 배우려면 수만 번의 시행착오가 필요한데, 이를 실제 웹사이트에서 하려면 막대한 비용이 든다. 게다가 웹페이지가 예측 불가능하게 변하거나 일시적으로 작동하지 않는 등의 문제로 학습이 불안정해진다.

다이나웹은 이런 문제를 근본적으로 해결하기 위해 '웹 세계 모형'이라는 가상 시뮬레이터를 만들었다. 이 모형은 마치 게임 속 가상 세계처럼, 현재 보고 있는 웹페이지와 AI가 하려는 행동(클릭, 타이핑 등)을 입력받으면 다음에 나타날 웹페이지 모습을 예측해낸다. 연구진은 실제 사람들이 웹사이트를 탐색한 기록을 대량으로 수집해 이 가상 시뮬레이터를 학습시켰다. 웹페이지는 '접근성 트리'라는 구조화된 형태로 표현되는데, 이는 웹페이지의 버튼, 텍스트 입력칸, 링크 같은 요소들을 나무 구조로 정리한 것이다.

진짜 경험 40% 섞었더니 성능 최고

다이나웹의 핵심 비결은 완전히 가상의 경험만 사용하지 않는다는 점이다. AI가 가상 환경에서 상상으로 만들어낸 연습 기록과 실제 사람이 웹사이트를 탐색한 진짜 기록을 적절히 섞어서 학습시킨다. 연구진의 실험 결과, 순수하게 가상 경험만으로 훈련하면 시뮬레이터가 잘못된 정보를 만들어내거나 오류가 쌓여 성능이 떨어졌다.

반면 약 40%의 실제 탐색 기록을 섞었을 때 가장 좋은 결과가 나왔다. 기존의 지도학습 방식보다 훨씬 높은 성능을 보였고, 실제 데이터 비율을 40%보다 더 높여도 성능 향상은 미미했다. 이는 적절한 양의 실제 경험이 AI 학습을 안정시키고 잘못된 학습 방향을 바로잡는 역할을 한다는 것을 보여준다. 대부분의 학습은 여전히 비용이 거의 들지 않는 가상 연습으로 할 수 있어, 실제 인터넷 사용을 극적으로 줄이면서도 성능을 유지할 수 있다.

연습 길이는 4~5단계가 최적, 너무 길면 독

연구진은 가상 환경에서 AI가 한 번에 연습하는 길이, 즉 몇 단계의 행동을 연속으로 시뮬레이션하는지가 학습 효과에 큰 영향을 미친다는 것을 발견했다. 평균 4~5단계 정도로 연습했을 때 가장 좋은 성능을 보였다.

이보다 짧으면 웹사이트에서 목표를 달성하는 데 필요한 여러 단계의 행동 순서를 제대로 배우지 못했다. 예를 들어 쇼핑몰에서 물건을 찾으려면 검색하고, 결과를 보고, 원하는 상품을 클릭하는 등 여러 단계가 필요한데, 너무 짧은 연습으로는 이런 연속 동작을 익히지 못한다.

반대로 너무 길게 연습하면 시뮬레이터가 만들어내는 가짜 웹페이지의 오류가 누적돼 오히려 학습에 방해가 됐다. 마치 잘못된 정보가 계속 쌓이면 전체 연습이 무의미해지는 것과 같다. 웹아레나와 웹보이저라는 두 가지 실험 환경 모두에서 이런 경향이 일관되게 나타났다.

쇼핑몰·구글·아마존에서 31~39% 성공

다이나웹은 웹아레나라는 테스트 환경에서 평균 31.0%의 성공률을 기록했다. 이는 기존의 강화학습 방식(26.7%)보다 16.1% 높은 수치다. 웹아레나는 레딧, 깃랩, 지도 서비스, 콘텐츠 관리 시스템, 쇼핑몰 등 5가지 종류의 가상 웹사이트 812개 과제로 구성됐다. 다이나웹은 특히 레딧에서 43.8%, 깃랩에서 28.7%, 쇼핑 부문에서 33.2%의 성공률을 보이며 여러 종류의 웹사이트에서 고르게 좋은 성능을 냈다.

실제 웹사이트를 대상으로 하는 웹보이저 테스트에서는 38.7%의 성공률을 기록했다. 이 테스트는 아마존, 애플, BBC 뉴스, 케임브리지 사전, 온라인 강의 사이트 코세라, 구글 맵, 구글 검색, AI 모델 공유 사이트 허깅페이스 등 실제로 사람들이 자주 쓰는 15개 웹사이트 643개 과제로 구성됐다.

특히 All Recipes라는 요리 레시피 사이트에서는 43.8%의 성공률을 보였고, BBC 뉴스에서는 61.6%, 구글 맵에서는 49.5%의 성공률을 달성했다. 이는 가상 훈련의 효과가 실제 인터넷 환경에서도 유효함을 보여준다. 다만 학술 논문 사이트 아카이브나 코드 공유 사이트 깃허브처럼 복잡한 장기 계획과 빠르게 변하는 페이지 구조가 필요한 곳에서는 아직 개선의 여지가 있다.

제대로 훈련된 시뮬레이터가 필수

연구진은 가상 웹 환경을 제대로 학습시키는 것이 얼마나 중요한지 확인하기 위해 추가 실험을 했다. 웹 탐색을 위해 특별히 훈련시킨 시뮬레이터 대신, 범용 AI 모델(GPT-oss-120b)을 그냥 프롬프트만 줘서 사용해봤다.

결과는 충격적이었다. 웹아레나에서 성공률이 31.0%에서 20.9%로 떨어졌고, 웹보이저에서는 35.4%에서 28.6%로 급락했다. 이는 아무리 똑똑한 범용 AI라도 웹 환경의 특성을 제대로 배우지 않으면 신뢰할 수 있는 가상 훈련장이 될 수 없다는 뜻이다.

이 결과는 다이나웹의 성능 향상이 단순히 더 큰 AI 모델을 쓰거나 영리한 질문 기법을 사용해서 나온 게 아니라, 웹사이트의 작동 방식을 명확히 학습한 전용 시뮬레이터 덕분임을 보여준다. 연구진은 이를 통해 복잡한 웹 환경에서 AI를 훈련시키려면 전문화된 가상 환경이 반드시 필요하다는 것을 입증했다.

FAQ (※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.)

Q1. 다이나웹은 실제 인터넷 없이 어떻게 AI를 훈련하나요?

A. 다이나웹은 '웹 세계 모형'이라는 가상 시뮬레이터를 사용합니다. 이는 게임처럼 가짜 웹 환경을 만들어, AI가 여기서 수천 번 연습할 수 있게 해줍니다. 현재 웹페이지와 AI의 행동을 입력하면 다음 페이지를 예측해주는 방식이라 실제 인터넷 접속이 필요 없습니다.

Q2. 가상 환경 훈련이 실제 웹 훈련보다 왜 더 좋나요?

A. 실제 웹에서 AI를 훈련하면 실수로 물건을 사버리거나 계정을 잘못 바꾸는 등의 위험이 있고, 수만 번 연습하려면 비용이 엄청납니다. 가상 환경에서는 이런 위험 없이 안전하게 무제한 연습할 수 있어 비용과 위험을 크게 줄입니다.

Q3. 다이나웹은 어떤 웹사이트에서 잘 작동하나요?

A. 아마존, 구글 맵, 뉴스 사이트, 레딧, 쇼핑몰 등 일반적인 웹사이트에서 높은 성공률을 보였습니다. 다만 깃허브나 학술 논문 사이트처럼 매우 복잡하고 빠르게 변하는 페이지에서는 아직 개선이 필요합니다.

기사에 인용된 리포트 원문은 arXiv에서 확인 가능하다.

리포트명: DynaWeb: Model-Based Reinforcement Learning of Web Agents

이미지 출처: 이디오그램 생성

해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.

인기 기사

번호	제목	글쓴이	작성일	조회	추천
설문	게임 캐릭터로 만들면 찰떡일 것 같은 아이돌은?	운영자	26/02/23	-	-
2114	저커버그, 프라다 패션쇼 전면 착석…메타 AI 안경 명품 버전 나오나 [1]	aimatters	02.27	1009	2
2113	구글, 이미지 생성 모델 '나노 바나나 2' 공개…4K 해상도에 속도까지 잡았다	aimatters	02.27	30	2
2112	잭 도시, 직원 절반 잘랐다…"당신 회사도 곧 같은 길 걷게 될 것"	aimatters	02.27	32	1
2111	챗GPT가 강박장애 환자를 더 아프게 만든다, '안심 로봇'의 위험한 진실 [2]	aimatters	02.27	681	0
2110	AI 데이터센터의 '친환경' 선언, 전력망을 들여다보면 허상이다	aimatters	02.27	33	0
2109	별점만 믿다간 낭패! ChatGPT가 470만 개 리뷰를 파헤쳐 밝혀낸 '맛집의 진짜 조건'	aimatters	02.27	34	0
2108	"ChatGPT가 편향됐다"는 말 한마디에 설득력 28% 급락 [10]	aimatters	02.26	2434	4
2107	챗GPT가 통계학 교육을 뒤흔들고 있다: 대학 강의실에서 벌어지는 AI 혁명	aimatters	02.26	64	0
2106	월 20달러짜리 챗GPT로 수학 난제 풀었다…'바이브 증명'의 충격적 실험 [13]	aimatters	02.26	2443	18
2105	앤트로픽, AI 에이전트 개발 스타트업 버셉트 인수…창업자 한명은 메타로	aimatters	02.26	27	0
2104	제미나이, 안드로이드에서 택시 호출·음식 배달 주문까지 자동화한다... 한국서도 적용	aimatters	02.26	48	0
2103	"AI 개발은 기타 배우기와 같다"…오픈클로 개발자가 전하는 AI 빌더 생존법	aimatters	02.26	65	0
2102	975g으로 AI 정복…한국레노버, 요가 11세대 4종 출시	aimatters	02.26	40	0
2101	AI가 내 말을 못 믿는다고? 음성 AI의 충격적인 편향 실험 결과 [2]	aimatters	02.25	650	2
2100	GPT-5도 이런 실수를 한다고? AI가 '알면서도 틀리는' 황당한 이유 [15]	aimatters	02.25	1763	6
2099	AI도 못 깨는 게임이 있다? 챗GPT·클로드·제미나이, 70년대 텍스트 게임 줄줄이 실패 [2]	aimatters	02.25	612	5
2098	오픈AI 투자자, 앤트로픽도 찍었다…VC 업계, 경쟁사에 투자하지 않는 '투자 충성도' 사실상 붕괴	aimatters	02.25	44	0
2097	" 美 연준도 AI 시대로 간다"…월러 이사, AI 전면 도입 전략 공개	aimatters	02.25	40	0
2096	AI가 플레이리스트 짜준다...스포티파이 리스트 자동생성 기능 영국·호주 등으로 확대	aimatters	02.25	34	0
2095	2028년 붕괴 시나리오로 전세계 공포, AI가 완벽하게 성공할수록 경제는 무너진다 [1]	aimatters	02.24	110	0
2094	AI가 "생각을 줄이면" 오히려 더 똑똑해진다? 토큰 예산과 LLM 추론의 역설	aimatters	02.24	63	0
2093	AI 전쟁 시뮬레이션, 가장 먼저 핵 투하를 지시한 AI 모델은?	aimatters	02.24	57	0
2092	AI가 교사보다 공정한 채점자가 될 수 있을까? GPT, 클로드, 제미나이의 교육 평가 실험	aimatters	02.24	34	1
2091	앤트로픽 "중국 AI 3사, 가짜 계정 2만4천 개로 클로드 기술 훔쳐갔다"	aimatters	02.24	65	0
2090	"하루 한 시간이면 AI를 직접 활용하라. 주변의 99%보다 앞서갈 수 있다"…AI 스타트업 CEO의 경고	aimatters	02.24	60	0
2089	오픈AI, 스마트 스피커·안경·조명까지…AI 하드웨어 제국 꿈꾼다	aimatters	02.24	58	0
2088	다쏘시스템, AI 전문가 '버추얼 동반자' 공개…인간과 AI의 산업 협업 시대 열린다	aimatters	02.24	41	0
2087	AI 안전장치도 '세탁'된다? 제미나이·클로드도 뚫렸다	aimatters	02.23	42	0
2086	AI가 사각형을 인식할 수 있을까? 클로드·챗GPT·제미나이 '공간 인식' 충격 실험	aimatters	02.23	41	0
2085	AI 로봇이 나를 설득한다? 챗GPT가 물리치료 거부 환자를 설득하는 방법	aimatters	02.23	33	0
2084	[신간] 난치병·빚에서 탈출한 30대 파이어족의 <버릴수록 부자 되는 미니멀리즘 재테크>	aimatters	02.23	41	0
2083	한 질문에 AI 4개가 토론한다…xAI, '그록 4.20' 공개	aimatters	02.23	34	1
2082	AI가 인간을 고용하는 시대 열렸다…"클로드(Claude)가 내 상사라면 이상적일 것"	aimatters	02.23	43	0
2081	"광고 대행사는 이제 필요 없다 우리에게 바로 광고해"…오픈AI 임원의 도발적 선언	aimatters	02.23	88	0
2080	"일기 쓰기 귀찮다고요?" AI가 대신 물어봐 주는 일기 앱 '블루닙' 출시	aimatters	02.23	39	0
2079	AI 코미디언이 인간보다 더 웃기다고? ‘기계다움’이 유머의 새 무기가 된다 [14]	aimatters	02.20	1526	2
2078	AI는 이제 '알아서 척척'… 2026년, 당신의 직장과 일상을 바꿀 AI의 민낯	aimatters	02.20	65	0
2077	AI는 영어만 편애한다, 전 세계 6,003개 언어 중 AI가 외면하는 언어들의 현실	aimatters	02.20	78	0
2076	구글, 제미나이 3.1 Pro 출시…추론 성능 전작 대비 2배 이상 향상	aimatters	02.20	85	0
2075	구글(Google) 제미나이(Gemini) 앱, AI 음악 생성 기능 품었다…"텍스트 한 줄이나 폰 앨범 동영상으로 30초 트랙을”	aimatters	02.20	1174	0
2074	"돈은 관심 없다"…오픈클로 개발자, 저커버그 제안 거절하고 알트만 택한 이유	aimatters	02.20	89	0
2073	오픈AI, 기업가치 850조 원 넘긴다…역대급 145조 원 투자 유치 임박	aimatters	02.20	50	0
2072	챗GPT에게 숙제 맡겼다가 낭패 본 고등학생들의 고백 [3]	aimatters	02.19	1412	3
2071	인터넷 없이도 폭주하는 AI, 스마트폰 속 챗봇이 돌변하는 지점 예측	aimatters	02.19	80	0
2070	엄마들이 육아 고민을 SNS 대신 AI에게 털어놓는 이유	aimatters	02.19	85	0
2069	챗GPT 프로, '90% 할인'… 카카오 선물하기 깜짝 특가	aimatters	02.19	159	0
2068	오픈AI, 초당 1,000토큰 생성하는 초고속 코딩 모델 'GPT-5.3-Codex-Spark' 공개	aimatters	02.19	87	0
2067	"AI 비서가 하루종일 일한다"… 오픈AI, 장시간 작동 AI 만드는 법 공개	aimatters	02.19	90	0
2066	구글 AI 모델 불법 복제 시도 10만 건 돌파… 북한·중국 해커, 피싱에 본격 활용 [7]	aimatters	02.19	2307	8
2065	구글 딥마인드의 제미나이, 수학·물리학 난제 해결하며 AI 연구 협력자로 진화	aimatters	02.19	72	0

최근 방문

즐겨찾기

즐겨찾기 갤러리

이미지 올리기 이용안내

갤러리 이슈박스, 최근방문 갤러리

연관 갤러리

개념글 리스트

차단하기

[AI 매터스 갤러리]

갤러리 본문 영역

추천 비추천

댓글 영역

① NFT 발행

② NFT 구매

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

페이지 이동

오른쪽 컨텐츠 영역

알림 설정

알림

디시콘 리스트

디시콘

디시콘 검색결과(0)

인기 디시콘