
지난주 정부가 'AI 국가대표' 후보 5개 팀을 선정하며 대한민국형 소버린 AI 육성 프로젝트를 본격적으로 시작했습니다.
오늘은 이 소버린 AI에 대해 자세히 얘기 나눠 보겠습니다.
한국방송통신전파진흥원 이상훈 원장 나와 있습니다.
먼저, 소버린 AI는 어떤 개념인가요?
[이 상 훈 / 한국방송통신전파진흥원장]
우선 '소버린 AI'에서 소버린(Sovereign)은 영어로서 이제 '주권의' 또는 '독립의'라는 뜻입니다.
그 얘기는 결국 소버린 AI는 독립적인 AI, 그리고 주체적인 AI를 의미하고 이것은 특히 우리나라와 같은 산업이라든가 경제 분야에서 글로벌 선진국 대열에 있는 나라들이 꼭 좀 가졌으면 하는 '자국의 AI' 이렇게 이해하시면 될 것 같습니다.
[앵커]
소버린 AI는 왜 지금 이 시점에서 특히 중요하게 부각이 되고 있는 걸까요?
[이 상 훈 / 한국방송통신전파진흥원장]
지금 뭐 너무나도 당연하게 AI가 정말 세상을 바꾸고 있고, 인류 문명에서 과연 이만큼 큰 변화를 가져오는 게 있을까? 라는 생각이 들 정도로 거대한 변화를 지금 가져오죠. 변화를 몰고 왔습니다. 그리고 이 변화에서 미국과 중국이 너무 앞서가고 있고, 다른 나라들은 상당히 좀 뒤떨어져 있습니다. 심지어는 EU라든가 프랑스 독일 같은 나라들. 그리고 한국 일본 같은 나라도 이 앞선 두 나라와는 격차가 너무 커지고 있기 때문에 지금 빨리 소버린 AI를 만들지 않으면 이들 두 나라의 AI에 의존할 수밖에 없는 그런 상황이 발생하는 거죠. 그렇게 되면 기술 개발부터 시작해서 더 나아가서 사회적인 부분까지 많은 부분에서 미국과 중국 이 두 나라의 AI를 의존하게 됨으로써 앞서 말씀드린 국가적인 정체성에 있어서, 특히 독립성 자주성 이런 것들이 위협을 받을 수 있기 때문에 굉장히 중요하게 부각이 되고 있다는 말씀을 드리겠습니다.
[앵커]
네. 앞서 소버린 AI의 개념을 말씀해 주셨고, 또 미국과 중국 같은 기술 강국들과의 기술 격차를 줄이기 위해서 소버린 AI의 시급성에 대해 말씀해 주셨는데요.
그렇다면 소버린 AI가 지키려는 AI 주권은 구체적으로 무엇을 의미하는 걸까요?
[이 상 훈 / 한국방송통신전파진흥원장]
네, 우선 첫째는 데이터입니다. 여기 데이터에는 우리 개인정보부터 시작해서 우리 정부와 기업의 굉장히 중요한 정보들, 꼭 보호해야 할 정보도 있고요. 그다음에 앞으로 우리가 개발해 나갈 여러 기술이라든가, 또는 우리의 정치·안보·외교 등 많은 정보를 우리의 AI에 학습을 시키고 그것을 통해서 추론한 내용을 의사 결정에 사용할 때에 우리가 자체적으로 보호할 수 있는 것이지, 만약에 이것을 외국 AI에 맡긴다면 그런 부분에 대해서 담보할 수가 없겠죠. 그런 부분에서 AI 주권을 우선적으로 얘기하고요. 더 나아가서 우리 사회의, 우리 국민의 가치관, 또 우리 사회의 규범·제도 이런 것들도 우리의 소버린 AI, 한국의 AI가 훨씬 더 잘 표현하고 또 정확하게 결론을 내는 데 있어서 더 유리하다. 그렇기 때문에 이 AI 주권이 이런 기술부터 시작해서 정보, 그리고 우리의 문화 전반에 이르기까지 한국적인 것을 가장 잘 표현한다. 이렇게 말씀드리겠습니다.
[앵커]
네 그렇군요. 해외에서는 소버린 AI를 어떤 방식으로 추진하고 있는지 궁금한데, 주요 국가들의 사례와 특징을 소개해 주실 수 있나요?
[이 상 훈 / 한국방송통신전파진흥원장]
앞서 말씀드린 바와 같이 이제 미국하고 중국이 훨씬 앞서 나가고 있으니까 다른 나라들은 혼자서 개발하는데 사실 좀 버거운 것이 현실입니다. 우선 EU 같은 경우는 유럽연합의 회원국들이 함께 공통의 소버린 AI를 만들자고 노력을 해서 약 300조 원을 투자해서 '인베스트AI 이니셔티브'라는 프로젝트를 추진하고 있습니다. 유럽 전역에 초대형 AI 모델 훈련용 'AI 기가 팩토리'를 최소 4곳 구축할 계획입니다. 그다음에 이 회원국 중에서 주축이라고 할 수 있는 프랑스와 독일도 대통령과 총리가 각각 이 소버린 AI를 구축하는 데 필요한 GPU를 최대한 이른 시일 내에 확보하겠다고 공언하고 예산을 거기에 맞춰서 준비하고 있습니다.
한편 우리와 가까운 동남아시아 지역도 싱가포르, 태국 그리고 인도네시아, 베트남 등의 나라들이 동남아시아 국가 연합을 대표해서 '씨라이언(SEA-LION) AI'라는 프로젝트, 동남아시아 언어와 문화 맥락을 정확히 반영하는 대규모 언어모델을 만들고 있습니다. 중동권에서는 아랍에미리트가 아랍어 전문 LLM '팔콘'을 선보였습니다. 그래서 아랍권의 문화와 가치를 반영하는 소버린 AI를 현재 구축하고 있다, 이렇게 말씀드리겠습니다.
[앵커]
이미 우리나라뿐만 아니라 전 세계적으로 소버린 AI가 지금 각광 받고 있군요.
이번에는 'AI 국가대표' 후보 5개 팀을 선정했다는 이야기를 이어가 볼 텐데요.
선정된 팀들은 각각 어떤 기술적 특징을 갖고 있는지 설명을 해 주시면 좋겠습니다.
[이 상 훈 / 한국방송통신전파진흥원장]
선정의 기준이 되는 항목들이 있습니다만, 이번에 선정된 팀들은 어쨌든 다른 팀보다는 특정 부분에서 강점을 보인, 특히 인정을 받은 건데요.
LG AI연구원 팀과 업스테이지 팀은 글로벌 성능 평가에서 뛰어난 성과를 거뒀습니다.
LG AI연구원의 '엑사원 4.0'과 업스테이지의 '솔라 프로 2'는 글로벌 성능에서 기술력에 강점이 있다는 평가를 받았고요.
그다음에 SK텔레콤 팀과 네이버클라우드 팀은 AI 생태계 전반에서의 역량 관점에서 강점을 보유하고 있다는 평가를 받았다고 합니다. 예를 들어서 SK텔레콤 팀은 반도체, 모델, 데이터, 서비스까지. 그리고 네이버클라우드 팀은 인프라, 모델, 데이터, 서비스 분야에서 자체 기술을 구현하는 능력이 높다는 평가를 받은 것으로 알려졌습니다.
마지막으로 NC AI 팀은 산업별 특화 모델 개발에서 강점을 지닙니다. 그래서 각 산업별로 특화된 전문 언어·멀티모달 모델로 제조, 유통, 미디어 산업 군의 맞춤형 모델을 개발하는 데 경쟁력이 있다는 평가를 받았다고 합니다.
[앵커]
AI 국가대표로 후보로 선정된 팀은 어떤 지원과 혜택을 받게 되는지도 궁금한데, 5개 팀으로 시작해서 27년도에 최종 2개의 팀이 선정되잖아요. 그 과정이 어떻게 되는지도 궁금합니다.
[이 상 훈 / 한국방송통신전파진흥원장]
뭐 간단하게 얘기하면 옛날에 '슈퍼스타K'라고 하는 노래 경연 대회가 있었죠. 그런 방식입니다. 그러니까 데스매치라고 하죠. 라운드를 거듭하면서 이제 한 팀 또는 한 명씩 탈락시키는 구조인데 이번에 다섯 팀을 선정했고, 이번 연말에 또 한 팀. 그래서 반기별로 내년 상반기와 하반기, 이렇게 또 한 팀씩 떨어뜨려서 내후년에는 최종 두 팀을 남기는 그러한 경연 방식이 되겠습니다.
그런데 이 과정에서 과기정통부는 GPU·데이터·인재를 이 팀들에게 지원을 할 텐데요.
구체적으로는 최종 선정된 5개 팀에 대해 GPU 인프라 확충 비용 1,500억 원, 데이터 구축 예산 628억 원, 우수 AI 인재 영입을 위한 자금 250억 원 등을 포함한 총 2,000억 원 규모의 직접 지원을 제공할 계획입니다.
그리고 좀 더 구체적으로 말씀드리면 GPU의 경우는 지금 제일 시급한 건데요.
사실 이 GPU가 앞서 말씀드린 미·중이나 EU에 비교할 때 그렇게 많은 것은 아닙니다만 그래도 당장 빨리 제공하게 되면 이들 팀들에게 굉장히 큰 도움이 될 거고요. 데이터 같은 경우는 지금 정부나 공공기관에서 보유하고 있는 공공 데이터를 공동 구매해서 바로 다음 달부터 제공을 할 겁니다. 그리고 또 방송 영상 데이터 같은 것도 학습을 위해서 지금 AI 개발에 제공을 할 것이고요. 그다음에 이제 브랜드 측면에서도 상당히 좀 도움이 될 거라고 생각을 합니다. 왜냐하면 이들 다섯 팀이 일단은 AI 기업, 'K-AI 기업' 'K-AI 모델'이라는 명칭이 부여될 것이고, 나머지 최종 두 팀은 정말로 더 큰 영예를 안게 되지 않을까. 이렇게 추측이 되고요. 그다음에 말씀드린 이 데스매치의 경영 과정에서 많은 국민들이 상당히 관심을 가지게 될 거라고 생각합니다. 그렇게 되면 그 팀의, 그 기업의 브랜드 가치가 국내에서는 물론이고 해외에서도 이런 대한민국의 AI 데스매치 경연을 흥미롭게 보지 않을까 그렇게 기대하고 있습니다.
[앵커]
기업들이 자체적으로 경쟁을 하면서 기술이 더 빠른 속도로 발전할 것 같습니다.
[이 상 훈 / 한국방송통신전파진흥원장]
바로 그렇습니다.
[앵커]
AI 국가대표 후보팀이 만들고 있는 AI 모델들을 우리는 어떤 식으로 활용할 수 있을까요?
[이 상 훈]
우선 이 AI 모델을 내가 어디서 좀 볼 수 있느냐. 이제 이게 궁금하실 텐데 지금 이 AI 모델들을 공개하고 있는 사이트가 있습니다.
미국 사이트인데 '허깅 페이스'라는 사이트가 있고요. 그곳에서 현재 선정된 국가대표 AI 모델들을 다운로드할 수 있습니다.
거기서 다운로드를 하면 (되는데), 뭐 정부 기관뿐만 아니라 기업은 물론이고 관심 있는 개인 개발자들도 활용할 수 있습니다.
그래서 이 모델들을 가지고 자기가 전문성을 가지고 있는 분야 또는 활용하고자 하는 분야의 데이터를 입력 후 학습을 시키면 바로 활용을 할 수 있다는 말씀을 드리고요. 저희 방송통신전파진흥원도 최근에 이런 테스트를 좀 해 봤습니다. 소버린 AI와 관련해서 한 말씀만 더 드리면 깜짝 놀랄 정도로 우리 기업이 만든 AI의 전반적인 규모가 소위 페르메트라고 하는데요. 빅테크의 것보다 10분의 1, 20분의 1 정도 수준밖에 안 되지만 우리 언어로 표현하는 능력은 놀라운 수준이었습니다. 소버린 AI가 이래서 필요하다는 것을 다시 한번 느꼈고요. 그래서 저희 같은 경우는 방송통신전파와 같은 분야에서 실제 국내 AI 모델들을 제대로 활용을 해보려고 이미 시작을 했습니다.
YTN 사이언스 박기현 (risewise@ytn.co.kr)
[YTN 사이언스 기사원문]
[프로그램 제작 문의] legbiz@ytn.co.kr
#AI #소버린AI #대한민국AI #AI국가대표 #AI주권
[저작권자(c) YTN science 무단전재, 재배포 및 AI 데이터 활용 금지]