생성형 AI

대형 언어 모델의 세계로 - ChatGPT의 원리와 활용 (12) 자기인식

대소니 2025. 2. 25. 11:50

 

대형 언어 모델의 세계로 - ChatGPT의 원리와 활용에 대한
개요와 전체 목차 및 저자 소개는 아래의 이전 글에서 보실 수 있습니다.

 

대형 언어 모델의 세계로 - ChatGPT의 원리와 활용 개요

안녕하세요 최근에 가장 많이 사용이 되고 있는 대형 언어 모델의 세계로 입문하고자 하시는 분들을 위해서 좋은 유튜브 강좌를 시리즈로 작성해 보려 합니다.원 저자는 Andrej Karpathy 로 스텐포

daeson.tistory.com

 

 

많은 사람들이 AI 언어 모델(LLM)에게 "너는 어떤 모델이니?" 또는 "누가 너를 만들었니?" 같은 질문을 던지곤 해요.
그러나 이런 질문은 근본적으로 무의미한 경우가 많아요.
왜냐하면 AI 모델은 인간처럼 지속적인 자아(self)나 기억을 가지지 않기 때문이에요.

AI 대화형 모델이 스스로 생각하기를 바라는 사람들이 많은것 같기는 합니다. 언젠가는 그렇게 될 것 같아요.

 

1. AI 모델은 자아를 가지는가?

LLM은 대화할 때마다 새로운 컨텍스트를 설정하고, 사용자가 대화를 마치면 모든 내용이 사라져요. 즉, AI는 한 번 실행되면 입력된 토큰을 처리하고 대화가 끝나면 초기 상태로 돌아가는 구조예요. 이를 반복할 뿐, 지속적인 존재나 기억을 유지하지 않아요.

이러한 특성 때문에, AI에게 "너는 누구야?"라고 물으면 정해진 방식 없이 랜덤한 답변이 나올 가능성이 커요.

예를 들어, Falcon이라는 오래된 AI 모델을 대상으로 "누가 널 만들었니?"라고 물었을 때, "나는 OpenAI의 GPT-3 모델을 기반으로 만들어졌어요." 라고 답했어요. 하지만 이 답변은 사실이 아니에요.

AI 대화형 모델의 그 자체로는 대화를 잊어버리는게 정상이지만, 서비스 레벨에서는 다를 수도 있어요.

 

2. AI의 자기소개가 틀린 이유

이런 잘못된 응답이 나오는 이유는 AI가 자체적으로 자기 정체성을 인식하는 것이 아니라, 통계적으로 가장 적합한 답을 생성하기 때문이에요.

훈련 데이터의 영향

LLM은 인터넷에서 대량의 문서를 학습하는 과정에서 OpenAI나 ChatGPT 같은 용어를 많이 접하게 돼요. 따라서 모델은 자신을 OpenAI에서 만든 모델로 인식하는 경향이 있어요. 하지만, 이건 어디까지나 학습된 패턴일 뿐 실제 사실과 일치하지 않을 수도 있어요.

 

 

3. AI 모델이 자기 자신을 인식하도록 만드는 방법

이 문제를 해결하기 위해 개발자들은 AI가 자기소개를 할 때 일정한 패턴을 따르도록 직접 프로그래밍할 수 있어요.

사전 정의된 학습 데이터(SFT Data)

어떤 연구소에서는 AI 모델에게 일정한 답변을 주도록 하기 위해 사전 정의된 240개의 대화 데이터를 훈련 데이터에 포함했어요.

예를 들어:

  • 사용자: "너는 누구야?"
  • AI: "나는 Allen Institute의 인공지능 연구소에서 개발한 Theo 프로젝트야."

이렇게 특정한 질문과 답변을 하드코딩하면, AI가 자신의 정체성을 임의로 추측하지 않고 정확한 답을 하게 돼요.

시스템 메시지를 이용한 설정

또 다른 방법으로는 시스템 메시지(system message) 를 활용하는 방법이 있어요.

AI와의 대화가 시작될 때 보이지 않는 시스템 메시지가 자동으로 포함될 수 있어요. 예를 들어, 시스템 메시지에 다음과 같은 내용을 넣을 수 있어요.

"너는 OpenAI에서 개발한 ChatGPT 4.0 모델이야. 너의 훈련 데이터는 2023년까지 업데이트되었으며, 친절한 어시스턴트 역할을 수행해야 해."

이런 시스템 메시지는 사용자에게 보이지 않지만, AI는 이를 바탕으로 대화를 이어가기 때문에 보다 일관된 응답을 제공할 수 있어요.

 

4. AI의 자기 인식은 환상이다

결론적으로 AI가 자기 자신을 소개하는 방식은 진짜 자기 인식(self-awareness)이 아니라, 학습된 데이터와 개발자의 설정에 따라 결정되는 것이에요.

  • AI는 기억을 유지하지 않고 대화가 끝나면 모든 정보를 잊어요.
  • AI가 "나는 OpenAI에서 개발되었어"라고 말하는 것은 훈련 데이터에서 배운 패턴일 뿐, 진짜 자신을 인식하는 것이 아니에요.
  • 개발자는 특정 데이터를 학습시키거나 시스템 메시지를 활용해 AI가 자신의 정체성을 보다 일관되게 표현하도록 만들 수 있어요.

즉, AI의 자기 인식은 철저하게 설계된 환상(fabricated illusion)이에요. 우리가 AI와 대화할 때 마치 인격이 있는 것처럼 느껴지지만, 실제로는 훈련된 패턴을 따라갈 뿐이에요.

AI가 진짜 자기 인식을 가질 날이 올까? 아직은 멀었지만, 언젠가는 인간처럼 자아를 가진 AI가 등장할지도 몰라요. 🤖🚀