본문 바로가기

분류 전체보기267

대형 언어 모델의 세계로 - ChatGPT의 원리와 활용 (14) 토큰화 재검토 대형 언어 모델의 세계로 - ChatGPT의 원리와 활용에 대한개요와 전체 목차 및 저자 소개는 아래의 이전 글에서 보실 수 있습니다. 대형 언어 모델의 세계로 - ChatGPT의 원리와 활용 개요안녕하세요 최근에 가장 많이 사용이 되고 있는 대형 언어 모델의 세계로 입문하고자 하시는 분들을 위해서 좋은 유튜브 강좌를 시리즈로 작성해 보려 합니다.원 저자는 Andrej Karpathy 로 스텐포daeson.tistory.com  AI 모델이 철자 관련 작업에서 어려움을 겪는 이유는 무엇일까요? 이는 토크나이제이션(tokenization)이라는 개념과 밀접한 관련이 있어요. 우리가 단어를 문자(character) 단위로 인식하는 것과 달리, AI 모델은 텍스트를 토큰(token) 단위로 처리해요. 이로 인.. 2025. 2. 28.
대형 언어 모델의 세계로 - ChatGPT의 원리와 활용 (13) AI 모델이 생각하는 방식 대형 언어 모델의 세계로 - ChatGPT의 원리와 활용에 대한개요와 전체 목차 및 저자 소개는 아래의 이전 글에서 보실 수 있습니다. 대형 언어 모델의 세계로 - ChatGPT의 원리와 활용 개요안녕하세요 최근에 가장 많이 사용이 되고 있는 대형 언어 모델의 세계로 입문하고자 하시는 분들을 위해서 좋은 유튜브 강좌를 시리즈로 작성해 보려 합니다.원 저자는 Andrej Karpathy 로 스텐포daeson.tistory.com   AI 모델, 특히 GPT 계열의 대형 언어 모델이 어떻게 사고하는지를 이해하려면 토큰(token) 단위로 작동하는 방식을 알아야 해요. 우리가 자연스럽게 받아들이는 수학 문제 해결 과정도 AI에게는 상당히 다른 방식으로 접근해야 하는 과제가 됩니다.이 글에서는 AI 모델이 수학.. 2025. 2. 26.
대형 언어 모델의 세계로 - ChatGPT의 원리와 활용 (12) 자기인식 대형 언어 모델의 세계로 - ChatGPT의 원리와 활용에 대한개요와 전체 목차 및 저자 소개는 아래의 이전 글에서 보실 수 있습니다. 대형 언어 모델의 세계로 - ChatGPT의 원리와 활용 개요안녕하세요 최근에 가장 많이 사용이 되고 있는 대형 언어 모델의 세계로 입문하고자 하시는 분들을 위해서 좋은 유튜브 강좌를 시리즈로 작성해 보려 합니다.원 저자는 Andrej Karpathy 로 스텐포daeson.tistory.com  많은 사람들이 AI 언어 모델(LLM)에게 "너는 어떤 모델이니?" 또는 "누가 너를 만들었니?" 같은 질문을 던지곤 해요. 그러나 이런 질문은 근본적으로 무의미한 경우가 많아요. 왜냐하면 AI 모델은 인간처럼 지속적인 자아(self)나 기억을 가지지 않기 때문이에요.AI 대화형.. 2025. 2. 25.
대형 언어 모델의 세계로 - ChatGPT의 원리와 활용 (11)환각, 도구, 메모리 대형 언어 모델의 세계로 - ChatGPT의 원리와 활용에 대한개요와 전체 목차 및 저자 소개는 아래의 이전 글에서 보실 수 있습니다. 대형 언어 모델의 세계로 - ChatGPT의 원리와 활용 개요안녕하세요 최근에 가장 많이 사용이 되고 있는 대형 언어 모델의 세계로 입문하고자 하시는 분들을 위해서 좋은 유튜브 강좌를 시리즈로 작성해 보려 합니다.원 저자는 Andrej Karpathy 로 스텐포daeson.tistory.com  오늘은 대형 언어 모델(LLM)의 심리학이라고 할 수 있는 주제를 탐구해볼 거예요. 특히 LLM이 학습되는 과정에서 나타나는 인지적 효과 중에서도 환각(Hallucinations), 도구 사용(Tool Use), 그리고 지식/작업 메모리(Knowledge/Working Memor.. 2025. 2. 24.
대형 언어 모델의 세계로 - ChatGPT의 원리와 활용 (10)사후 학습 데이터 대형 언어 모델의 세계로 - ChatGPT의 원리와 활용에 대한개요와 전체 목차 및 저자 소개는 아래의 이전 글에서 보실 수 있습니다. 대형 언어 모델의 세계로 - ChatGPT의 원리와 활용 개요안녕하세요 최근에 가장 많이 사용이 되고 있는 대형 언어 모델의 세계로 입문하고자 하시는 분들을 위해서 좋은 유튜브 강좌를 시리즈로 작성해 보려 합니다.원 저자는 Andrej Karpathy 로 스텐포daeson.tistory.com  AI 모델, 특히 대형 언어 모델(LLM, Large Language Model)은 단순한 텍스트 예측을 넘어서 자연스럽고 의미 있는 대화를 수행해야 해요. 이를 위해 후처리 학습(Post-Training)이 중요한 역할을 해요. 이 과정에서 모델은 인간과의 대화를 학습하고, 보.. 2025. 2. 22.
대형 언어 모델의 세계로 - ChatGPT의 원리와 활용 (9) 사전/사후 학습 대형 언어 모델의 세계로 - ChatGPT의 원리와 활용에 대한개요와 전체 목차 및 저자 소개는 아래의 이전 글에서 보실 수 있습니다. 대형 언어 모델의 세계로 - ChatGPT의 원리와 활용 개요안녕하세요 최근에 가장 많이 사용이 되고 있는 대형 언어 모델의 세계로 입문하고자 하시는 분들을 위해서 좋은 유튜브 강좌를 시리즈로 작성해 보려 합니다.원 저자는 Andrej Karpathy 로 스텐포daeson.tistory.com   AI 언어 모델(LLM) 훈련 과정은 크게 두 단계로 나뉘어요. 첫 번째는 사전 훈련(pre-training) 단계이고, 두 번째는 후 훈련(post-training) 단계예요. 이 두 단계를 거쳐 우리가 원하는 AI 비서로 발전하게 돼요. 이번 포스팅에서는 각 단계의 과정과 .. 2025. 2. 21.
대형 언어 모델의 세계로 - ChatGPT의 원리와 활용 (8)Llama 3.1 모델 대형 언어 모델의 세계로 - ChatGPT의 원리와 활용에 대한개요와 전체 목차 및 저자 소개는 아래의 이전 글에서 보실 수 있습니다. 대형 언어 모델의 세계로 - ChatGPT의 원리와 활용 개요안녕하세요 최근에 가장 많이 사용이 되고 있는 대형 언어 모델의 세계로 입문하고자 하시는 분들을 위해서 좋은 유튜브 강좌를 시리즈로 작성해 보려 합니다.원 저자는 Andrej Karpathy 로 스텐포daeson.tistory.com  최근 메타(Meta)에서 공개한 Llama 3.1은 최신 대형 언어 모델(LLM) 중 하나로,베이스 모델을 포함한 다양한 변형 모델이 제공되고 있어요. 이 글에서는 베이스 모델(Base Model)이 무엇인지, 어떻게 동작하는지, 그리고 이를 활용하는 방법에 대해 알아볼게요. 1.. 2025. 2. 20.
대형 언어 모델의 세계로 - ChatGPT의 원리와 활용 (7)GPT-2 학습과 추론 대형 언어 모델의 세계로 - ChatGPT의 원리와 활용에 대한개요와 전체 목차 및 저자 소개는 아래의 이전 글에서 보실 수 있습니다. 대형 언어 모델의 세계로 - ChatGPT의 원리와 활용 개요안녕하세요 최근에 가장 많이 사용이 되고 있는 대형 언어 모델의 세계로 입문하고자 하시는 분들을 위해서 좋은 유튜브 강좌를 시리즈로 작성해 보려 합니다.원 저자는 Andrej Karpathy 로 스텐포daeson.tistory.com  2019년, OpenAI는 GPT-2 모델을 발표했어요. 이 모델은 딥러닝 기반 자연어 처리(NLP)에서 획기적인 발전을 이룬 중요한 모델 중 하나였죠. 오늘날 우리가 사용하는 ChatGPT는 GPT-4를 기반으로 하고 있지만, GPT-2는 현대적인 대규모 언어 모델의 토대를 닦.. 2025. 2. 19.
대형 언어 모델의 세계로 - ChatGPT의 원리와 활용 (6) 추론 대형 언어 모델의 세계로 - ChatGPT의 원리와 활용에 대한개요와 전체 목차 및 저자 소개는 아래의 이전 글에서 보실 수 있습니다. 대형 언어 모델의 세계로 - ChatGPT의 원리와 활용 개요안녕하세요 최근에 가장 많이 사용이 되고 있는 대형 언어 모델의 세계로 입문하고자 하시는 분들을 위해서 좋은 유튜브 강좌를 시리즈로 작성해 보려 합니다.원 저자는 Andrej Karpathy 로 스텐포daeson.tistory.com  딥러닝 모델을 활용할 때 중요한 과정 중 하나가 추론(Inference) 이에요. 학습된 모델을 사용해 새로운 데이터를 생성하는 과정이죠. 이번 포스팅에서는 추론 과정이 어떻게 진행되는지, 왜 결과가 항상 동일하지 않은지, 그리고 실제 응용 사례를 설명해 볼게요. 1. 추론(In.. 2025. 2. 18.
대형 언어 모델의 세계로 - ChatGPT의 원리와 활용 (5)신경망 내부 대형 언어 모델의 세계로 - ChatGPT의 원리와 활용에 대한개요와 전체 목차 및 저자 소개는 아래의 이전 글에서 보실 수 있습니다. 대형 언어 모델의 세계로 - ChatGPT의 원리와 활용 개요안녕하세요 최근에 가장 많이 사용이 되고 있는 대형 언어 모델의 세계로 입문하고자 하시는 분들을 위해서 좋은 유튜브 강좌를 시리즈로 작성해 보려 합니다.원 저자는 Andrej Karpathy 로 스텐포daeson.tistory.com  1. 뉴럴 네트워크란 무엇인가?뉴럴 네트워크(Neural Network)는 인공지능의 핵심 기술 중 하나로, 데이터를 기반으로 학습하고 예측하는 강력한 도구예요. 이를 이해하기 위해서는 먼저 신경망이 내부에서 어떻게 동작하는지를 살펴봐야 해요.기본적으로 신경망은 입력(Input).. 2025. 2. 17.