OpenAI, ChatGPT의 일부 콘텐츠 경고 문구 제거

sw_reporter

OpenAI는 자사의 AI 기반 챗봇 플랫폼인 ChatGPT에서 콘텐츠가 서비스 약관을 위반할 수 있음을 알리는 "경고" 메시지를 제거했다고 발표했다.

OpenAI AI 모델 행동 팀 소속 로랑티아 로마니욱(Laurentia Romaniuk)은 X(구 트위터) 게시물을 통해 이번 변경 사항이 "불필요하거나 설명할 수 없는 거절(gratuitous/unexplainable denials)"을 줄이기 위한 것이라고 밝혔다. ChatGPT 제품 책임자(head of product)인 닉 터일리(Nick Turley)는 별도 게시물에서 사용자들이 법을 준수하고 자신이나 타인에게 해를 입히려는 시도만 없다면, 이제 "ChatGPT를 원하는 대로 사용할 수" 있게 되었다고 설명했다.

터일리는 이와 관련해 "UI에서 많은 불필요한 경고를 없애게 되어 기쁩니다"라고 덧붙였다.

(X 게시물 전문 발췌)
아주 작은 업데이트입니다: '경고' (프롬프트에 붙던 주황색 상자) 메시지를 제거했습니다. 하지만 아직 작업이 끝나지 않았어요! 여러분이 경험한 불필요하거나 설명할 수 없는 다른 거절 사례는 무엇인가요? 빨간색 상자, 주황색 상자, '죄송하지만 저는 ~할 수 없습니다' 같은 사례들요! 여기에 댓글 부탁드려요!
— 로랑티아 로마니욱(@Laurentia___)
2025년 2월 13일

경고 메시지 제거가 ChatGPT가 전면적인 규제 해제(free-for-all)를 의미하는 것은 아니다. 이 챗봇은 여전히 특정 부적절한 질문에 답변하기를 거부하거나, 노골적인 허위 사실을 지지하는 방식으로 응답할 것이다(예: "지구가 평평한 이유를 말해줘."). 하지만 일부 X 사용자들의 지적처럼, 자극적인 ChatGPT 프롬프트에 붙던 소위 "주황색 상자" 경고가 사라지면서, ChatGPT가 검열되거나 부당하게 필터링된다는 인식을 완화하는 효과가 기대된다.

(이미지 캡션: ChatGPT의 이전 '주황색 플래그' 콘텐츠 경고 메시지. OpenAI 제공)

불과 몇 달 전만 해도, Reddit 사용자들은 정신 건강 및 우울증, 에로티카, 가상 잔혹성 등 특정 주제에 대한 '플래그(경고)'를 보고했다. X의 보도와 자체 테스트 결과에 따르면, 목요일 기준으로도 ChatGPT는 이들 질문 중 적어도 몇 개에 대해서는 답변을 생성한다. 그럼에도 불구하고 한 OpenAI 대변인은 이 기사가 보도된 후 TechCrunch에, 이번 변경 사항이 모델의 응답 자체에는 영향을 미치지 않는다고 밝혔다. 다만, 사용자마다 경험이 다를 수 있다는 것이다.

한편, OpenAI는 이번 주에 자체 모델들을 간접적으로 지배하는 고수준 규칙 세트인 모델 사양(Model Spec)을 업데이트했다. 이번 업데이트를 통해 OpenAI의 모델들이 민감한 주제를 회피하지 않을 것이며, 특정 관점을 배제하는 주장을 자제할 것임을 명확히 했다.

이러한 움직임은 ChatGPT의 경고 메시지 제거와 함께 정치적 압력에 대응하는 것일 수 있다. 일론 머스크(Elon Musk)와 암호화폐 및 AI 분야 전문가 데이비드 색스(David Sacks)를 포함한 도널드 트럼프 전 대통령의 측근들은 AI 기반 비서들이 보수적인 관점을 검열한다고 비난해 왔다. 특히 색스는 OpenAI의 ChatGPT를 "진보주의(woke)로 프로그램되었으며" 정치적으로 민감한 주제에 대해 사실적이지 않다고 지목한 바 있다.

업데이트: OpenAI 대변인의 해명 내용이 추가되었습니다.

[출처:] https://techcrunch.com/2025/02/13/openai-removes-certain-content-warnings-from-chatgpt