분류 전체보기279 대형 언어 모델의 세계로 - ChatGPT의 원리와 활용 (6) 추론 대형 언어 모델의 세계로 - ChatGPT의 원리와 활용에 대한개요와 전체 목차 및 저자 소개는 아래의 이전 글에서 보실 수 있습니다. 대형 언어 모델의 세계로 - ChatGPT의 원리와 활용 개요안녕하세요 최근에 가장 많이 사용이 되고 있는 대형 언어 모델의 세계로 입문하고자 하시는 분들을 위해서 좋은 유튜브 강좌를 시리즈로 작성해 보려 합니다.원 저자는 Andrej Karpathy 로 스텐포daeson.tistory.com 딥러닝 모델을 활용할 때 중요한 과정 중 하나가 추론(Inference) 이에요. 학습된 모델을 사용해 새로운 데이터를 생성하는 과정이죠. 이번 포스팅에서는 추론 과정이 어떻게 진행되는지, 왜 결과가 항상 동일하지 않은지, 그리고 실제 응용 사례를 설명해 볼게요. 1. 추론(In.. 2025. 2. 18. 대형 언어 모델의 세계로 - ChatGPT의 원리와 활용 (5)신경망 내부 대형 언어 모델의 세계로 - ChatGPT의 원리와 활용에 대한개요와 전체 목차 및 저자 소개는 아래의 이전 글에서 보실 수 있습니다. 대형 언어 모델의 세계로 - ChatGPT의 원리와 활용 개요안녕하세요 최근에 가장 많이 사용이 되고 있는 대형 언어 모델의 세계로 입문하고자 하시는 분들을 위해서 좋은 유튜브 강좌를 시리즈로 작성해 보려 합니다.원 저자는 Andrej Karpathy 로 스텐포daeson.tistory.com 1. 뉴럴 네트워크란 무엇인가?뉴럴 네트워크(Neural Network)는 인공지능의 핵심 기술 중 하나로, 데이터를 기반으로 학습하고 예측하는 강력한 도구예요. 이를 이해하기 위해서는 먼저 신경망이 내부에서 어떻게 동작하는지를 살펴봐야 해요.기본적으로 신경망은 입력(Input).. 2025. 2. 17. 대형 언어 모델의 세계로 - ChatGPT의 원리와 활용 (4)신경망 입출력 대형 언어 모델의 세계로 - ChatGPT의 원리와 활용에 대한개요와 전체 목차 및 저자 소개는 아래의 이전 글에서 보실 수 있습니다. 대형 언어 모델의 세계로 - ChatGPT의 원리와 활용 개요안녕하세요 최근에 가장 많이 사용이 되고 있는 대형 언어 모델의 세계로 입문하고자 하시는 분들을 위해서 좋은 유튜브 강좌를 시리즈로 작성해 보려 합니다.원 저자는 Andrej Karpathy 로 스텐포daeson.tistory.com 지난번에 데이터셋의 텍스트 시퀀스를 토크나이저를 사용해 토큰 시퀀스로 변환했어요.결과를 보면, 예를 들어 Fine Web 데이터셋에서는 약 44테라바이트의 디스크 공간을 차지하는 데이터가 있으며, 이는 약 15조 개의 토큰 시퀀스로 구성되어 있어요. 여기에서 우리가 보는 것은 .. 2025. 2. 13. 대형 언어 모델의 세계로 - ChatGPT의 원리와 활용 (3)토큰화 대형 언어 모델의 세계로 - ChatGPT의 원리와 활용에 대한개요와 전체 목차 및 저자 소개는 아래의 이전 글에서 보실 수 있습니다. 대형 언어 모델의 세계로 - ChatGPT의 원리와 활용 개요안녕하세요 최근에 가장 많이 사용이 되고 있는 대형 언어 모델의 세계로 입문하고자 하시는 분들을 위해서 좋은 유튜브 강좌를 시리즈로 작성해 보려 합니다.원 저자는 Andrej Karpathy 로 스텐포daeson.tistory.com 토큰화(Tokenization)텍스트를 어떻게 표현할 것인가?우리는 텍스트를 컴퓨터에서 처리할 수 있도록 변환해야 해요. 뉴런 네트워크 모델들은 1차원(onedimensional) 순차적 심볼(sequence of symbols)을 입력으로 받아요. 또한, 이 심볼들은 유한한 개.. 2025. 2. 12. 대형 언어 모델의 세계로 - ChatGPT의 원리와 활용 (2)학습데이터 대형 언어 모델의 세계로 - ChatGPT의 원리와 활용에 대한개요와 전체 목차 및 저자 소개는 아래의 이전 글에서 보실 수 있습니다. 대형 언어 모델의 세계로 - ChatGPT의 원리와 활용 개요안녕하세요 최근에 가장 많이 사용이 되고 있는 대형 언어 모델의 세계로 입문하고자 하시는 분들을 위해서 좋은 유튜브 강좌를 시리즈로 작성해 보려 합니다.원 저자는 Andrej Karpathy 로 스텐포daeson.tistory.com 사전 훈련 단계 개요AI 모델을 훈련하는 과정은 여러 단계로 구성돼 있어요. 그중 첫 번째 단계가 사전 훈련(pre-training)이에요.이 과정에서 가장 먼저 해야 할 일은 인터넷에서 데이터를 다운로드하고 처리하는 것이에요.이 과정이 어떻게 이루어지는지 감을 잡으려면, Hug.. 2025. 2. 11. 대형 언어 모델의 세계로 - ChatGPT의 원리와 활용 (1)소개 대형 언어 모델의 세계로 - ChatGPT의 원리와 활용에 대한 개요와 전체 목차 및 저자 소개는 아래의 이전 글에서 보실 수 있습니다. 대형 언어 모델의 세계로 - ChatGPT의 원리와 활용 개요안녕하세요 최근에 가장 많이 사용이 되고 있는 대형 언어 모델의 세계로 입문하고자 하시는 분들을 위해서 좋은 유튜브 강좌를 시리즈로 작성해 보려 합니다.원 저자는 Andrej Karpathy 로 스텐포daeson.tistory.com 1. 들어가며안녕하세요, 여러분! 오늘은 우리가 자주 사용하는 인공지능(AI) 기반 대형 언어 모델, 특히 ChatGPT에 대해 알아보려고 해요. 이 글에서는 AI가 어떻게 작동하는지, 우리가 입력하는 문장들이 어떻게 처리되는지를 쉽게 설명해 드릴게요.ChatGPT를 사용하다 .. 2025. 2. 10. 대형 언어 모델의 세계로 - ChatGPT의 원리와 활용 개요 안녕하세요 최근에 가장 많이 사용이 되고 있는 대형 언어 모델의 세계로 입문하고자 하시는 분들을 위해서 좋은 유튜브 강좌를 시리즈로 작성해 보려 합니다.원 저자는 Andrej Karpathy 로 스텐포드의 천재 박사로 AI 업계에서는 유명인이지요.3일전에 유튜브에 공개한 3시간 30분짜리 영상에 인공지능 대형 모델에 대한쉽게 풀어낸 원리를 공개했는데 ChatGPT의 원리와 활용에 대해서 아주 잘 설명하고 있습니다.이번 시리즈 포스팅을 통해서 입문자들에게 좋은 학습 기회가 되기를 희망합니다. Deep Dive into LLMs like ChatGPT 영상 목차00:00:00 소개 / Introduction00:01:00 사전 학습 데이터 (인터넷) / Pretraining Data (Internet)00.. 2025. 2. 9. ChatGPT의 새로운 기능 ‘Tasks’, 스케줄링도 AI와 함께 시간은 금이야! ChatGPT에 새롭게 추가된 ‘Tasks’ 기능은 매일 아침 9시에 맞춰 최신 AI 뉴스를 알아서 요약해주거나, 일주일에 3번씩 운동 리마인더를 보내주는 등 ‘자동화된 스케줄러’ 역할을 해줄 수 있어요. 간단히 말해, “매일 특정 시간에 특정 정보를 챙겨줘”라고 설정해두면 ChatGPT가 직접 찾아서 알려주는 식이에요. 예를 들어 “매일 저녁 7시에 이메일 확인하라고 알려줘”라고 지시해두면, 내가 깜빡하고 있어도 정해진 시간에 꼭 알림을 해주니 일상 관리가 훨씬 편리해졌어요.특히 이 기능의 놀라운 점은 최대 10개의 작업까지 동시에 예약할 수 있다는 사실이에요. 예를 들어, 하나는 “매주 월요일 오전 8시에 주간 식단 계획 알려줘”, 또 다른 하나는 “매일 밤 10시에 ‘오늘 하루 어떻게 보냈는지’ 피.. 2025. 1. 17. 로봇 AI 혁명, NVIDIA가 그리는 미래 CES 2025 CES에서 엔비디아의 젠슨 황은 기술 혁신을 통해 로봇 AI의 발전을 가속화하겠다고 선언했어요. 이번 발표에서는 최신 GPU 아키텍처와 AI 기술의 결합이 가져올 변화를 강조했는데요, 특히 자율주행차, 로봇공학, 에너지 효율성 등 다양한 분야에서 중요한 성과를 소개했어요. 1. 블랙웰 GPU: 차세대 컴퓨팅의 시작블랙웰 GPU는 차세대 컴퓨팅의 판도를 확 바꿀 만한 성능을 보여줬어요. 920억 개의 트랜지스터와 초당 4,000TOPS의 연산 능력은, 단순히 숫자가 높다기보다 이전 세대 대비 약 3배 이상이나 뛰어난 결과예요. 고성능 그래픽 처리에서 중요한 건 파워풀한 하드웨어뿐 아니라, 실제 작업을 어떻게 효율적으로 처리하느냐인데, 블랙웰 아키텍처는 이 점에서 탁월함을 증명했어요.특히 텐서 코어(Ten.. 2025. 1. 16. AI 데이터센터, 2027년까지 40%가 전력 부족 예상 가트너(Gartner)는 최근 발표에서 생성 AI 운영을 위한 데이터센터의 전력 수요 증가로 인해, 2027년까지 데이터센터의 40%가 전력 부족 문제를 겪을 것이라고 예측했어요. 이는 생성 AI 시장의 폭발적 성장과 더불어 하이퍼스케일 데이터센터의 급증이 주요 원인으로 꼽히고 있어요. 데이터센터 전력 문제의 주요 요인전력 수요의 급증생성 AI 운영을 위해 신규 하이퍼스케일 데이터센터가 빠르게 설립되고 있어요. 이런 데이터센터는 서버 10만 대 이상을 운영하며, 전력 공급업체의 용량 확장 속도를 초과하는 전력 수요를 만들어내죠.예상 전력 소비량가트너는 2027년까지 AI 최적화 서버 운영에 필요한 전력이 연간 **500테라와트시(TWh)**에 이를 것으로 예상했어요. 이는 2023년 대비 약 2.6배 증.. 2025. 1. 2. 이전 1 2 3 4 5 6 ··· 28 다음