챗GPT, AGI 달성?
하루가 다르게 발전하는 인공지능 세상이다.
12월 초, 오픈AI는 'o1 프로' 버전을 선보였다. 이 버전의 구독 비용은 무려 월 200달러이다. 환율 영향으로 우리 돈으로는 약 30만 원에 달한다. 일반 버전 구독 비용이 월 20달러임을 감안하면 어마어마한 가격 상승이 아닐 수 없다.
그렇다면 무슨 기능을 추가로 제공하기에 비용이 이렇게 뛰었을까? 새로운 버전은 수학, 코딩, 글쓰기 등 다양한 분야의 파워 유저를 위해 설계되었다. 'o1 프로'는 여러 벤치마크 테스트에서 수학, 프로그래밍, 과학 등 여러 전문 분야에서 박사급 이상의 성적을 거두었음을 내세운다. 프리뷰 버전보다 훨씬 뛰어난 성능을 보이며, 기술적 완성도를 입증하고 있다.
몇 날 며칠을 고민하던 끝에 결국 결제 버튼에 손이 가고 말았다.
오픈AI는 연말을 맞아 12일 동안 매일 하나씩 자신들의 성취를 공개하는 이벤트인 '십마스(Shipmas)'를 진행했다. 마지막 날, 그들은 'o1'의 후속작 'o3'를 공개했다. 그리고 이 'o3'의 성능은 인간을 뛰어넘었다.
일부 언론에서는 AGI(인공일반지능)의 시작이라는 기사를 쏟아냈다.
12월 21일 공개된 'o3'는 월 30만 원짜리 'o1'을 크게 능가하는 성능을 보여주며, 복잡하고 추론이 필요한 작업을 처리할 수 있음을 입증했다.
특히 'o3'는 ARC-AGI라는 벤치마크에서 인간의 능력을 뛰어넘는 점수를 기록했다. 이 벤치마크는 인간은 직관적으로 이해하지만 인공지능은 어려움을 겪는 공간과 도형 문제를 다룬다. 이 테스트에서 인간이 받을 수 있는 점수는 85점이다. 그래서 85점을 넘는 인공지능이 등장하면, AGI급 인공지능이 등장했다고 볼 수 있다는 의견이 많았다.
그리고 'o3'는 이 테스트에서 87.5점을 기록했다.
수학과 과학 문제에서도 'o3'는 박사 학위 소지자들의 성적을 크게 넘어섰다. AIME라는 수학경시대회에서는 96.7점을 기록하며, 'o1'의 83.3점을 압도적으로 뛰어넘었고, 박사 수준 과학 문제 평가에서도 기존 버전 대비 10점 가까이 향상을 보였다.
개인적으로 가장 놀란 부분은 코딩 성적이다. 코딩 능력을 평가하는 코드포스(Codeforces) 점수도 'o1'의 1,891점에서 'o3'는 2,727점으로 상승했다. 점수만 보면 어느 정도인지 가늠하기 어렵다. 그래서 코드포스 점수 분포도를 아래에 가져왔다.
많은 개발자들은 1,000점 전후에 분포하고 있다. 알고리즘 문제를 제공하는 '백준' 사이트의 문제를 손쉽게 풀어내는 수준이면 보통 1,500점 정도라는 평가를 받는다. 나 역시 한창 때는 백준 문제를 풀었으나, 요즘은 두뇌가 많이 녹슬어서 1,000~1,500점 사이 점수가 아닐까 싶다.
'o3'의 2,727점은 그래서 놀랍다. 상위 0.1% 수준의 코딩 실력을 'o3'가 보여준 것이다. 오픈AI의 'o3' 발표날 참석한 마크 첸 연구 담당 수석 부사장은 자신의 점수가 2,500점 정도라며, 'o3' 하나를 도입하면 오픈AI의 수석과학자급을 영입한 것과 같다는 비유를 했다.
오픈AI는 'o3'를 대대적으로 홍보하면서도 AGI의 시작이라는 말은 아꼈다. 샘 알트먼 CEO는 'o3'를 '인공지능의 새로운 단계이자 AGI에 근접한 최초의 모델'이라고 표현했다. AGI가 가진 무게감 때문에 조심스럽게 표현했지만, 우리는 AGI에 가까이 다가선 인공지능을 목도하고 있다.
글 서두로 돌아가자.
월 30만 원짜리 인공지능 서비스를 구독했다고 하면 돈을 낭비한다고 생각하는 사람들이 있을 것이다.
하지만 반대로 생각해 보자.
박사급 연구원을 월 30만 원에 채용했다고 생각한다면? 과거에는 대학원 인건비가 눈물 날 정도였지만, 요즘에는 수백 만원의 인건비를 제공하는 연구실들이 많다. 이런 상황에서 'o3'급 퍼포먼스를 가진 박사급 연구원을 채용한다면 그 비용은 얼마를 지불해야 할까? 반면 'o3'는 불평불만도 가지지 않고, 24/7 일할 수 있다.
또한, 전 세계 상위 0.1% 코딩 마스터 수준의 능력을 가진 사람을 고용한다면 얼마를 지불해야 할까? 실제로, 코드포스에서 2700점을 받는 개발자는 연봉 수억 원을 받는 것이 일반적이다. 그런 수준의 조수를 월 30만 원에 사용할 수 있다면, 이는 단순한 비용이 아닌 투자라고 볼 수 있지 않을까?
아직 챗GPT 프로는 'o1'을 제공한다. 하지만 'o3'가 내년 초에 공개될 예정이다. 벌써부터 인공지능과의 협업이 기대가 된다. 그때까지 코딩으로 해야 할 일은 좀 미뤄놓을까?
개인적으로 바쁜 나날을 보내는 와중에 인공지능 세상에서 들려오는 소식은 더 정신이 없습니다. 이미 인공지능 산업계에서는 며칠 지난 뉴스지만, 엄청 핫했던 'o3' 내용을 정리해 보았습니다.
오늘 글에는 긍정적인 면만을 강조했지만, 여러 우려 섞인 이야기도 나오고 있습니다. 이 부분은 추후 다뤄보도록 하겠습니다. 다만, 학기 말 성적 처리도 해야 하고, 연말 행정 처리로 정신이 없는 나날들입니다.
개인적으로도 12월에 두 번째 책 원고 마감을, 1월에는 패스트캠퍼스 오프라인 강의 준비, 그리고 2월까지 브런치북 공모전 대상 작품을 마감해야 합니다. 그래서 올해 올리는 글은 오늘이 마지막일 것 같습니다. 미리 새해 인사 드립니다. 새해 복 많이 받으세요. :)
저의 첫째 아들이 컴공을 하고 있어서, 잘 모르는 컴퓨터와 AI를 알수 있는 작가님의 글은 아들과의 대화에 정말 많은 도움이 되고 있습니다. 저는 댓글을 잘 달지 않지만 올해 마지막이라 용기내어 올립니다. 감사합니다. 새해 복 많이 받으십시오.^^
오 아드님이 컴공 전공이시군요! 요즘 가장 핫한 분야죠 ㅎㅎ 저도 순수 컴공은 아니라, 이쪽 전공하시는 분들 보면 정말 존경스럽니다. 그 수많은 디버깅 과정을 엉덩이로 이겨내신 분들이니 말이죠 ^^ 작가님도 그리고 가족 분들도 모두 새해 복 많이 받으시기 바랍니다! ^^
정신없언 2024년, 교수님 덕분에 정리 잘하고 갑니다. 출간 준비 잘하시구요^^ 책으로 뵙겠습니다!새해 복 많이 받으세요!
2024년은 정말 여러 모로 정신 없었던 것 같습니다. 2024년초와 지금을 비교해보면 인공지능의 발전도 정말 넘사벽인데요. 내년엔 과연 어떻게 될지 기대도 되고 또 두렵기도 하고 그렇습니다. 늘 응원해주셔서 감사합니다. 작가님도 새해 복 많이 받으세요 :)
저도 요즘 챗gpt를 자주 쓰고 있는데요. 제가 사용할 줄 몰라서 그런지, 아니면 무료 버전의 한계인지, 생각만큼 활용도가 높지는 않더라고요. 물론 검색에 쓰는 시간을 어느 정도 줄여주는 효과는 있는데요. "와 이런 것도 찾아주는구나!"하는 경우는 많지 않네요. 그리고 틀린 정보가 꽤나 많아서 주의해야 할 것 같습니다. 가장 충격적인 오류는 "무라카미 하루키는 슬하에 아들 한 명을 두고 있다"와 "무라카미 하루키가 한국을 좋아해서 종종 방문한다"였네요-_- 교양서 집필은 사실 레퍼런스 정리가 거의 절반인 작업이라서요. 그 부담을 확실히 덜어만 준다면 저도 유료로 쓸 의향이 있는데요. 아직 효과를 확신하지 못하겠어서 못 지르겠어요. 하긴 무료와 유료의 문제가 아니라 제가 그만큼 쓸 줄을 몰라서 그럴지도 모르겠습니다.
유료와 무료 버전 차이가 많이 납니다 ^^; 무료 버전 챗GPT는 그냥 심심이 수준인 것 같아요 ㅎㅎ 유료버전은 기본적으로 검색을 할 때 웹을 찾는데, 무료는 그냥 자신이 가지고 있는 디비에서 생성을 하니, 정확도가 많이 떨어집니다. 검색만을 위하신다면 퍼플렉시티 무료가 그나마 괜찮고요. 그리고 프롬프트 작성하실 때, 신뢰 가능한 링크만 참조하라는 식으로 해주면 좋습니다. 하지만, 대부분의 생성형 인공지능은 유료버전부터 진가를 발휘하긴 합니다.
레퍼런스 정리를 위해서라면 노션이나 노트북LM도 많이 쓰는 것 같습니다. 메모 앱들이 생성형 인공지능을 탑재하거든요. 요즘은 그 어떤 앱도 생성형 인공지능 탑재가 기본인 것 같습니다.
@최재운 무료 버전은 심심이 수준이라닠ㅋㅋㅋㅋ 빵 터졌어요. 여윽시 이 바닥의 생리는 그럴 수밖에 없죠. 하긴 AI면 요즘 자본주의 경제의 최전선인데, 무료와 유료의 차이는 넘사벽인 게 당연할 것 같습니다. 제가 너무 순진했네욬ㅋㅋㅋ 댓글에 늘 성실하게 답변 달아주셔서 감사해요. 제 이야기하느라 댓글에 연말 인사도 제대로 못했네요. 올 한해 많은 성취를 이루심에 축하드리고요. 남은 한해 잘 마무리하시기를 바랍니다. 새해에 또 새로운 글로 뵙죠^^
@배대웅 다시 생각해보면 심심이라고 한 건 좀 너무 했던 것 같기도 합니다 ㅎㅎ 무료 버전도 프롬프팅을 잘 하면 나름 쓸만하긴 합니다. 프롬프팅 잘 하는 법은 제 다음 책에 살짝 나옵니..ㅎㅎㅎㅎㅎ 근데 무료 버전으로 팩트 체크는 절대로 하지 마시기 바랍니다. 특히나 챗GPT로는요. ^^; 저도 작가님과 한 해 너무 즐거웠습니다. 새해에도 자주 인사 나누고 직접 뵙기도 하고 하면 좋겠습니다. 즐거운 성탄절 되시고, 새해 복 많이 받으세요 ^^
와우 이 바쁘신 와중에 오픈 AI 의 o3 소개까지~~ 감사합니다.
작가님도 여러 책들 잘 완성하시며~~
복된 새해 되시길요.
o3 소식은 넘어갈래야 넘어갈 수가 없었습니다 ㅎㅎㅎ 온갖 SNS가 난리가 났는데, 브런치는 조용한 것 같아서 의무감(?)에 찔끔 간단하게만 적어봤습니다 ^^;;; 응원 감사합니다. 작가님도 새해 복 많이 받으시기 바랍니다!
30만 원짜리라니요? 후덜덜. 도대체 O3는 얼마나 성능이 좋을지 궁금합니다. ^^ 이제 놀랄 것 같지는 않습니다. 이미 충분히 놀라서, 뭘 해도, 그래, AI는 그렇게 하겠지 싶지만 그래도 궁금하네요.
그나저나 작가님 책도 잘 되어서, 이제 방송에도 나오시고 그러시길 바랍니다. AI 관련 글 항상 재미 있게 읽고 있어요.
사람들이 우려하는 게 o1이 30만원이면 o3는 300만원으로 나오는 거 아니냐입니다. 오픈AI가 아니라도 어느 기업이 인공지능을 독점하게 되면 접근성이 많은 사람들에게 제한되지 않을까 우려가 나오고 있습니다. 물론 업계 관계자는 무료 버전을 계속 공개할 것이라 하지만, 이미 무료와 유료 성능 차이가 많이 나는 상황이라 ^^; 작가님의 격려섞인 응원 진심으로 감사드립니다. 부지런히 글 작성하시는 모습에서 많이 배우고 있습니다. 평온한 연말 되시고, 새해 복 많이 받으세요 ^^
이렇게 똑똑한 인공지능들이 우후죽순 등장하니.. 저 같은 평범한 인간들이 일할 곳이 점점 적어지지 않을까 우려됩니다ㅜㅜ 근데 o3은 오쓰리로 읽는 건가요?ㅎㅎ
역대급으로 바쁘시지만 행복하실 작가님! 현재와 미래의 독자로서 작가님의 행보에 박수를 보냅니다^^
인공지능을 잘 활용하는 사람이 두각을 나타낼 것이라는 전망들이 많이 나오고 있죠. 아무리 인공지능이 똑똑해도 어딘가 나사 하나 빠진 모습을 많이 보이기에, 결국 사람과의 협업이 중요한데요. 이를 할 줄 아냐가 앞으로 사회에서 중요한 스킬셋이 될 것 같습니다. o3는 오쓰리로 읽는 것 같아요 ㅋㅋ 저도 영상은 아직 안 봐서 ^^; 늘 응원해주셔서 감사합니다! 즐거운 성탄절 되시고, 새해 복 많이 받으세요. :)
후유... AGI 무섭다는 생각이 먼저 듭니다. 하긴 소프트웨어 가격이 비싸죠. 학교나 회사나 기관에서 구입하면 비싼 가격은 아닐 텐데, 연구비 없는 개인에게는 부담되는 가격이겠어요. 그나저나 제가 주변에 작가님 자랑을 하느라 바빠요~ ㅋ
이미 인공지능 구독 비용이 ㅎㄷㄷ 합니다. 저만해도 쓰는 인공지능이 4~5개 되는데, 이거 비용이 만만치 않더라고요. 방학 때까지만 써보고 필요한 것만 남기려고 합니다 ^^;; 그나저나 자랑을 해주시다니! 넘 감사합니다 ㅋㅋ 사실 교수 세계가 글 쓰고, 책 쓰고 하는 건 좀 무시(?)하는 경향이 있어서, 전 학과 교수님들께도 이야기 잘 안 합니다. 정말 친한 교수님들께만 슬쩍 ㅎㅎㅎㅎㅎㅎ
와우, 금액이 어마무시해서 엄두가 나지않지만 기대되네요 ^^
특히 전문가께서 말씀하시는 내용이라 더욱 더 기대 됩니다.
지금 개발시장을 보면 RAG가 대세인 듯합니다. 아무래도 "효율"이라는 측면에서는
B2B 시장에서 RAG가 자리잡은 듯합니다. 특히 "보안"이슈가 크기에 지식을 B2B에서는
클라우드(ChatGPT, Claude, ...)에 대한 거부감이 상당합니다.
아마도 AI 시장이 B2C와 B2B(G)가 달라지지 않을까?라는 생각을 하게 됩니다.
마지막에 패캠 강의하신다고 하셨을 때 잠깐 미소를 지었습니다.
저도 2015년부터 2019까지 24기(대략 500~600시간) 가량
"Android 개발 or 입문" 관련 오프라인 강의를 했었습니다.
전 패캠이 대표포함 7명이던 스타트업이었던 시절에 강의 시작해서,
100명 넘는 대기업이 되는 순간부터 하지 않았습니다.
(어느순간 강사들의 프로필이 넘사벽으로 화려해져서 부담감이 들더라고요 ^^)
무엇을 하시던간에 "랜드마크한 업적"을 이루실 것을 믿습니다.
보안 이슈 때문에 대기업은 상당히 민감하게 대응하더라고요. 삼성은 자체 LLM을 구축했고, SK는 오픈AI 통해서 자체 서버를 구축해서 서비스 한다고 하더라고요. KT도 MS랑 뭘 한다고 하고. B2B는 B2C처럼 막 쓸 수 없으니 조심해야 하지 않을까 싶습니다.
B2G하니 요즘 대세인 팔란티어가 떠오르네요. 오늘도 국방 관련 AI 솔루션 제공한다고 기사가 떴던데. 그래서인지, 요즘 주식 시장에서 가장 핫한 것 같더라고요. 물론 피터 틸 영향도 있는 것 같지만요. AI 관련 정보들이 개미들에게 좋은 소스가 되는 것 같습니다 ^^;
와 패스트캠퍼스에서도 강의를 하셨군요! 전 지금의 대기업적인 모습만 봐서, 그때가 상상이 잘 안가네요. 강의 협의한다고 본사를 방문했는데, 직원 수가 ㅎㄷㄷ 하더라고요. 상장도 준비한다던데. 요즘은 거의 모든 강의가 인공지능 개발 혹은 인공지능 활용이더라고요. 예전에는 C나 자바 이런 걸 많이 배웠었는데, 세월이 많이 변한 것 같습니다. ^^
올 한 해 좋은 말씀 감사했습니다. 새해 복 많이 받으시기 바랍니다!
세상이 끝도 없이 더 복잡해지겠구나 싶습니다. ㅎ
ai의 도움을 받을지 말지 판단하는 가장 큰 기준은 결국 비용이 되는 거고요. 90년대 말에 핸드폰을 무료로 뿌리지 않았다면 이 정도 변화가 가능했을까 싶어요. 초기에는 핸드폰의 유해성에 대한 논의도 제법 많았지만(신호 연결될 때 귀에 가까이 대면 안 된다. 목에 걸고 다니면 건강에 해롭다.ㅎㅎㅎ ㅎ ), 핸드폰의 편의성이 모든 걸 압도했죠. ai도 같은 상황을 반복할런지ㅡ
그러나 이것이 어떤 한 영역의 발달이 아니라 삶의 양식이 바뀌는 중요한 전환(예전에 작가님이 쓰셨던 글에서 본 것 같네요)이라는 것에 집중해 대비를 하면 얼마나 좋을까요. 철로도 신호도 없이 기차만 빨라지는 느낌이에요.
역시 작가님의 글은 언제나 재밌습니다^^ 찬찬히 설명해 주셔서 흥미롭게 읽어보았네요. 사용 후기 궁금해지네요. ㅎ 기대하겠습니다.
작가님도 올 한 해 많은 일이 있으셨네요. 고생 많으셨습니다. 계획하신 일들 잘 마무리 지으시고 내년에도 좋은 작품 활동 기대하겠습니다. 새해 복 많이 받으세요!