본문 바로가기

Ai16

대형 언어 모델의 세계로 - ChatGPT의 원리와 활용 (4)신경망 입출력 대형 언어 모델의 세계로 - ChatGPT의 원리와 활용에 대한개요와 전체 목차 및 저자 소개는 아래의 이전 글에서 보실 수 있습니다. 대형 언어 모델의 세계로 - ChatGPT의 원리와 활용 개요안녕하세요 최근에 가장 많이 사용이 되고 있는 대형 언어 모델의 세계로 입문하고자 하시는 분들을 위해서 좋은 유튜브 강좌를 시리즈로 작성해 보려 합니다.원 저자는 Andrej Karpathy 로 스텐포daeson.tistory.com   지난번에 데이터셋의 텍스트 시퀀스를 토크나이저를 사용해 토큰 시퀀스로 변환했어요.결과를 보면, 예를 들어 Fine Web 데이터셋에서는 약 44테라바이트의 디스크 공간을 차지하는 데이터가 있으며, 이는 약 15조 개의 토큰 시퀀스로 구성되어 있어요. 여기에서 우리가 보는 것은 .. 2025. 2. 13.
대형 언어 모델의 세계로 - ChatGPT의 원리와 활용 (3)토큰화 대형 언어 모델의 세계로 - ChatGPT의 원리와 활용에 대한개요와 전체 목차 및 저자 소개는 아래의 이전 글에서 보실 수 있습니다. 대형 언어 모델의 세계로 - ChatGPT의 원리와 활용 개요안녕하세요 최근에 가장 많이 사용이 되고 있는 대형 언어 모델의 세계로 입문하고자 하시는 분들을 위해서 좋은 유튜브 강좌를 시리즈로 작성해 보려 합니다.원 저자는 Andrej Karpathy 로 스텐포daeson.tistory.com  토큰화(Tokenization)텍스트를 어떻게 표현할 것인가?우리는 텍스트를 컴퓨터에서 처리할 수 있도록 변환해야 해요. 뉴런 네트워크 모델들은 1차원(onedimensional) 순차적 심볼(sequence of symbols)을 입력으로 받아요. 또한, 이 심볼들은 유한한 개.. 2025. 2. 12.
대형 언어 모델의 세계로 - ChatGPT의 원리와 활용 (2)학습데이터 대형 언어 모델의 세계로 - ChatGPT의 원리와 활용에 대한개요와 전체 목차 및 저자 소개는 아래의 이전 글에서 보실 수 있습니다. 대형 언어 모델의 세계로 - ChatGPT의 원리와 활용 개요안녕하세요 최근에 가장 많이 사용이 되고 있는 대형 언어 모델의 세계로 입문하고자 하시는 분들을 위해서 좋은 유튜브 강좌를 시리즈로 작성해 보려 합니다.원 저자는 Andrej Karpathy 로 스텐포daeson.tistory.com  사전 훈련 단계 개요AI 모델을 훈련하는 과정은 여러 단계로 구성돼 있어요. 그중 첫 번째 단계가 사전 훈련(pre-training)이에요.이 과정에서 가장 먼저 해야 할 일은 인터넷에서 데이터를 다운로드하고 처리하는 것이에요.이 과정이 어떻게 이루어지는지 감을 잡으려면, Hug.. 2025. 2. 11.
대형 언어 모델의 세계로 - ChatGPT의 원리와 활용 (1)소개 대형 언어 모델의 세계로 - ChatGPT의 원리와 활용에 대한 개요와 전체 목차 및 저자 소개는 아래의 이전 글에서 보실 수 있습니다. 대형 언어 모델의 세계로 - ChatGPT의 원리와 활용 개요안녕하세요 최근에 가장 많이 사용이 되고 있는 대형 언어 모델의 세계로 입문하고자 하시는 분들을 위해서 좋은 유튜브 강좌를 시리즈로 작성해 보려 합니다.원 저자는 Andrej Karpathy 로 스텐포daeson.tistory.com  1. 들어가며안녕하세요, 여러분! 오늘은 우리가 자주 사용하는 인공지능(AI) 기반 대형 언어 모델, 특히 ChatGPT에 대해 알아보려고 해요. 이 글에서는 AI가 어떻게 작동하는지, 우리가 입력하는 문장들이 어떻게 처리되는지를 쉽게 설명해 드릴게요.ChatGPT를 사용하다 .. 2025. 2. 10.
대형 언어 모델의 세계로 - ChatGPT의 원리와 활용 개요 안녕하세요 최근에 가장 많이 사용이 되고 있는 대형 언어 모델의 세계로 입문하고자 하시는 분들을 위해서 좋은 유튜브 강좌를 시리즈로 작성해 보려 합니다.원 저자는 Andrej Karpathy 로 스텐포드의 천재 박사로 AI 업계에서는 유명인이지요.3일전에 유튜브에 공개한 3시간 30분짜리 영상에 인공지능 대형 모델에 대한쉽게 풀어낸 원리를 공개했는데 ChatGPT의 원리와 활용에 대해서 아주 잘 설명하고 있습니다.이번 시리즈 포스팅을 통해서 입문자들에게 좋은 학습 기회가 되기를 희망합니다.  Deep Dive into LLMs like ChatGPT 영상 목차00:00:00 소개 / Introduction00:01:00 사전 학습 데이터 (인터넷) / Pretraining Data (Internet)00.. 2025. 2. 9.
로봇 AI 혁명, NVIDIA가 그리는 미래 CES 2025 CES에서 엔비디아의 젠슨 황은 기술 혁신을 통해 로봇 AI의 발전을 가속화하겠다고 선언했어요. 이번 발표에서는 최신 GPU 아키텍처와 AI 기술의 결합이 가져올 변화를 강조했는데요, 특히 자율주행차, 로봇공학, 에너지 효율성 등 다양한 분야에서 중요한 성과를 소개했어요.  1. 블랙웰 GPU: 차세대 컴퓨팅의 시작블랙웰 GPU는 차세대 컴퓨팅의 판도를 확 바꿀 만한 성능을 보여줬어요. 920억 개의 트랜지스터와 초당 4,000TOPS의 연산 능력은, 단순히 숫자가 높다기보다 이전 세대 대비 약 3배 이상이나 뛰어난 결과예요. 고성능 그래픽 처리에서 중요한 건 파워풀한 하드웨어뿐 아니라, 실제 작업을 어떻게 효율적으로 처리하느냐인데, 블랙웰 아키텍처는 이 점에서 탁월함을 증명했어요.특히 텐서 코어(Ten.. 2025. 1. 16.
LearnLM, 교육 혁신을 이끄는 AI의 숨겨진 전략 이글은 최근 구글에 발표한 테크니컬 리포트를 기반으로 합니다.교육을 위한 교사와 교육적인 방침을 유지할 수 있는 교육 AI 모델에 대해서 알아보겠습니다. 1. 교육 기술의 과거와 현재오늘날 생성 AI는 정보를 제시하는 데 중점을 둡니다.그러나 인간 교사처럼 학습을 도울 수는 없습니다.AI 시스템에 교육적 행동을 주입하는 방법,즉 'pedagogical instruction following' 프레임을 도입합니다.이 방식은 특정한 교육 정의에 얽매이지 않습니다.대신 교사나 개발자가 모델 행동을 지정할 수 있습니다.이 방법은 두 가지 큰 장점을 제공합니다.첫째, 특정 교육 데이터 추가가 가능합니다.둘째, 기존 모델 기능 확장이 용이합니다.이를 통해 Gemini 모델의 학습 능력도 개선되었다고 합니다.2. L.. 2025. 1. 2.
AI와 검색의 미래: 트렌드, 기술, 그리고 사용자 반응 분석 인공지능(AI) 기술의 발전은 검색 분야에 혁신적인 변화를 가져오고 있습니다. 단순 키워드 매칭을 넘어 사용자의 의도를 파악하고 개인 맞춤형 결과를 제공하는 AI 검색 엔진은 사용자 경험을 향상시키고 정보 접근성을 높이는 데 기여하고 있습니다1. 본 보고서는 AI와 검색 분야의 최신 트렌드를 분석하고 주요 브랜드, 기술, 기능, 사용자 반응, 그리고 미래 전망을 심층적으로 조사하여 AI 검색의 현황과 미래를 제시합니다. 최신 트렌드: 당신이 알아야 할 6가지 변화1) 고도화된 검색 엔진의 등장AI는 검색 엔진의 진화를 이끌고 있습니다. 최신 검색 엔진은 고급 알고리즘과 자연어 처리 기술을 활용해 사용자의 의도를 더 정확히 파악하고, 원하는 정보를 보다 신속하게 제공합니다. 단순히 키워드 일치를 넘어, 문.. 2024. 12. 29.
Sana, 엔비디아가 만든 이미지 생성형 AI (우수AI에서 사용가능) 안녕하세요! 오늘은 NVIDIA에서 만든 최첨단 이미지 생성 기술 Sana를 소개해드리려고 합니다.Sana는 텍스트를 이미지로 변환하는 혁신적인 프레임워크로, 최대 4096×4096 해상도의 고품질 이미지를 빠르고 효율적으로 생성할 수 있습니다. 특히 놀라운 점은 일반적인 노트북 GPU에서도 활용이 가능하다는 점인데요. 이미지-텍스트 정합성이 뛰어나며, 높은 해상도를 유지하면서도 속도가 매우 빠릅니다. 이러한 성과는 Sana가 적용한 독창적인 설계 덕분인데, 복잡한 기술도 쉽게 이해할 수 있도록 친절히 풀어드리겠습니다.Sana의 핵심은 네 가지로 요약할 수 있습니다. 첫째, 이미지 데이터를 32배 압축할 수 있는 딥 컴프레션 오토인코더로 기존 대비 처리 속도를 크게 향상시켰습니다. 둘째, 고해상도 이미지.. 2024. 12. 2.
AI 에이전트의 현황 및 활용4 - 성공의 열쇠 안녕하세요 여러분!최근 몇 년 동안 대형 언어 모델(LLM) 기술의 급속한 발전은 기업에게 혁신을 가속화할 수 있는 놀라운 기회를 제공하고 있습니다. 이러한 기술을 통해 고객 서비스, 데이터 분석, 의사 결정 지원 등 다양한 분야에서 혁신적인 변화를 도입할 수 있게 되었습니다. 그러나, 이러한 가능성에도 불구하고, 실제 운영 환경에 에이전트를 배포하는 일은 만만치 않은 도전 과제를 포함하고 있습니다.에이전트의 성능: 성공의 열쇠가장 중요한 요소 중 하나는 바로 성능 품질입니다. 여러 기업들이 LLM 기반 에이전트를 도입하고 있지만, 조사에 따르면 약 45.8%의 소규모 기업이 성능 품질을 최우선 과제로 꼽았습니다. 이는 비용 절감보다도 중요한 요소로 인식되고 있으며, 신뢰할 수 있는 고성능 에이전트를 개.. 2024. 11. 26.