오픈AI(OpenAI)가 23일(현지시간) 텍스트 내 개인식별정보(PII·Personally Identifiable Information)를 자동으로 탐지·삭제해주는 오픈 웨이트 모델 '프라이버시 필터(Privacy Filter)'를 공개했다. 오픈AI 공식 발표에 따르면 이 모델은 사용자의 기기 안에서 직접 실행되도록 설계돼, 민감한 데이터가 외부 서버로 전송되지 않은 상태에서 마스킹을 처리할 수 있다.
프라이버시 필터는 규모는 작지만 프런티어급 개인정보 탐지 능력을 갖췄다는 점이 특징이다. 대량의 데이터를 빠르게 처리해야 하는 고처리량 워크플로에 최적화돼 있으며, 최대 12만 8000 토큰까지의 컨텍스트를 한 번에 스캔할 수 있다. 길어진 문서나 대화 로그에서도 중간에 끊김 없이 PII를 걷어낼 수 있다는 의미다.
지원 카테고리는 총 8종이다. 개인 식별자(private person), 주소(address), 이메일(email), 전화번호(phone), URL, 날짜(date), 계정 번호(account number), 비밀번호 등 기밀 정보(secret)가 포함된다. 오픈AI는 이 카테고리 구성이 일반적 PII 보호 기준은 물론, AI 학습 데이터 정제나 고객 지원 로그 저장 같은 기업용 워크플로에 바로 적용할 수 있다고 설명했다.
공개 방식도 주목된다. 모델이 오픈 웨이트 형태로 제공되면서, 기업이나 개발자는 자사 인프라에 이 모델을 직접 탑재해 데이터가 외부로 나가지 않도록 통제할 수 있다. 금융·의료·공공 등 규제 업종에서 프라이빗 클라우드나 온프레미스 환경에 바로 얹어 쓸 수 있다는 점이 강점으로 꼽힌다.
특히 GPT-5.5 공개와 같은 날 프라이버시 필터가 발표됐다는 점에서, 오픈AI가 프런티어 모델 성능과 기업 친화적 프라이버시 도구를 동시에 제공하는 방향으로 제품 전략을 정렬하고 있다는 평가가 나온다. 업계에서는 '더 강력한 모델을 팔기 위해 더 강력한 프라이버시를 팔아야 하는 시대'로 AI 산업이 진입했음을 보여주는 상징적 발표라는 해석도 제기된다.
프라이버시 필터는 허깅페이스(Hugging Face)와 깃허브(GitHub)를 통해 배포되며, 상업적 이용을 포함한 광범위한 라이선스가 적용됐다. 오픈AI는 이 모델이 GPT-5.5의 파트너 제품으로 설계됐다고 설명하면서, 챗GPT 엔터프라이즈와 연계해 기업 데이터가 모델 외부로 유출되지 않도록 보호하는 '데이터 게이트웨이' 역할을 수행할 수 있다고 밝혔다.
자세한 내용은 오픈AI에서 확인할 수 있다.
이미지 출처: 오픈AI
댓글 영역
획득법
① NFT 발행
작성한 게시물을 NFT로 발행하면 일주일 동안 사용할 수 있습니다. (최초 1회)
② NFT 구매
다른 이용자의 NFT를 구매하면 한 달 동안 사용할 수 있습니다. (구매 시마다 갱신)
사용법
디시콘에서지갑연결시 바로 사용 가능합니다.