오픈AI, 내달 한층 개선된 ‘달리3’ 출시 예고∙∙∙“정확한 이미지 생성으로 이용자 요구 이해↑”

달리3+챗GPT 통합∙∙∙일일이 명령어 입력할 필요 없어
폭력적∙외설적 유해한 콘텐츠 생성 막기 위한 보호 장치 구축
“인공적으로 생성된 콘텐츠 식별 방법 실험 중”
내달부터 챗GPT 엔터프라이즈, 챗GPT 플러스에 먼저 제공∙∙∙무료 버전 관련 언급 없어

[스타트업투데이] 생성형 인공지능(Generative AI) ‘달리’(Dall-E)의 업그레이드 버전이 나올 전망이다.

미국 <블룸버그(Bloomberg)>는 20일(현지시각) 오픈AI(OpenAI)가 이미지 생성 도구 ‘달리’의 세 번째 버전인 ‘달리3’(Dall-E3)를 공개했다고 발표했다.

앞서 오픈AI는 2021년 1월 달리를, 이듬해 4월 달리에서 한 층 개선된 달리2(DALL-E2)를 선보였다.

보도에 따르면 달리3는 달리2보다 더 정확하게 이미지를 생성할 수 있으며 이용자의 요구를 더 잘 이해하는 것으로 전해진다. 특히 오픈AI가 달리3와 챗GPT를 통합했다는 점에서 이용자는 일일이 명령어(Prompt)를 입력할 필요가 없게 됐다.

예를 들어 챗GPT와 문답을 통해 명령어를 작성해달라고 요청하면 챗GPT가 명령어를 생성하고 이를 토대로 달리3가 이미지를 생성하는 식이다.

무엇보다 폭력적이거나 외설적으로 유해한 콘텐츠 생성을 막기 위한 보호 장치를 갖췄다는 게 이번 업데이트의 핵심이다. 이를 위해 오픈AI는 언어 모델에 특정 단어를 무시하도록 AI를 훈련시켰으며 명령어에 구체적인 이름이 언급됐어도 공인의 이미지를 생성할 수 없도록 했다.

오픈AI 측은 “인공적으로 생성된 콘텐츠를 식별하는 방법을 실험 중”이라며 “이번에 공개한 달리3는 오픈AI의 이미지 생성 기술력이 한층 더 높아진 것을 보여준다”고 전했다.

오픈AI는 달리3를 10월부터 기업용 챗봇 ‘챗GPT 엔터프라이즈’(ChatGPT Enterprise)와 유료 버전 ‘챗GPT 플러스’(ChatGPT Plus)에 먼저 제공할 계획이다. 무료 버전과 관련해서는 언급하지 않았다.

오픈AI가 개발한 ‘달리’는?

오픈AI는 대화형 AI 챗봇 ‘챗GPT’를 개발한 미국 비영리연구소다. 챗GPT와 달리 외에도 대규모 언어예측 모델 ‘GPT-3.5’를 기반으로 다국적 음성인식 AI ‘위스퍼’(Whisper) 등을 선보이며 자사만의 생성 AI 기술을 발전시켜왔다.

오픈AI가 개발한 ‘달리’는 개념적인 표현으로 구성된 문장으로부터 다양한 이미지를 생성하는 AI다. 120억 개의 모수(모집단의 데이터)를 갖는 GPT-3 모델을 활용해 텍스트-이미지 데이터를 학습한다.

오픈AI의 기반 기술로 꼽히는 GPT-3는 생성적 사전 학습(Generative Pre-Training)의 세 번째 버전이다. 오픈AI 지난 2020년 공개한 이후 자연어처리(NLP, Natural Language Processing) 분야를 넘어 AI 산업의 패러다임 변화를 일으키기도 했다.

소프트웨어정책연구소(SPRI)가 지난 2021년 보고한 ‘인공지능 최신 동향과 시사점’에 따르면 달리는 개념과 관계로 표현된 문장을 이해하며 이를 다양한 이미지로 표현하는 능력이 우수하다고 나와 있다. 특히 달리가 생성한 이미지는 사물이나 동물을 의인화하거나, 이미지에 문자를 입히는 등 관계가 없는 두 개념을 그럴듯하게 연결시키는 방식으로 언어의 다양성이 반영돼 있다.

보고서는 “달리는 ▲생성할 객체의 모양 및 위치 조정 ▲3차원 이미지 생성 ▲지리학적∙시대적 지식 표현 등 언어로 표현되는 다양한 개념과 관계를 이미지로 전환하는 능력 보유하고 있다”며 “AI의 산업적 활용 측면에서 잠재성이 높을 것”이라고 전망했다.

그러면서도 “다만, 달리를 AI의 기술적 진보라고 보는 것보다는 오픈AI의 GPT-3 모델을 성공적으로 적용한 사례로 볼 수 있다고”며 “앞으로 창의성이 강조되는 디자인 분야, 특히 AI 기반 생성 모델이 많이 활용되고 있는 패션이나 홈인테리어에서 적용될 가능성이 높아 산업적 가치가 클 것으로 기대된다”고 덧붙였다.

생성형 AI 둘러싼 경쟁↑∙∙∙“정부 차원의 AI 규제 필요”

한편 생성형 AI를 두고 국내∙외 기술 기업 간 경쟁은 더욱 치열해질 전망이다. 지난해 오픈AI가 달리2를 공개한 이후 생성형 AI 시장이 크게 성장한 데다 스테이블디퓨전(Stable Diffusion), 미드저니(Midjourney) 등의 경쟁 기업이 주목받고 있기 때문이다.

실제로 지난 1월 미국 내 크리에이터가 AI 학습에 본인의 허가 또는 동의 없이 이미지를 사용했다는 이유로 스테이블디퓨전과 미드저니 등 이미지 생성형 AI 기업을 상대로 소송을 제기했으며 그다음 달에는 영국 게티이미지(Getty Images)가 자사 사이트 안에 있는 1,200만 개의 이미지를 복제했다며 스테이블디퓨전에 문제를 제기했다.

지난 3월에는 미국 월스트리트저널(WSJ) 및 뉴스미디어얼라이언스(News Media Alliance)가 방대한 신문기사를 AI가 학습∙운영하는 것에 대한 보상체계 및 법적 관계 등을 논의해야 한다고 발표했다. 이보다 앞선 지난해 11월에는 마이크로소프트(MS), 깃허브(GitHub) 등이, 최근에는 미국 드라마 <왕좌의 게임(Game of Thrones)> 원작자 조지 마틴(George Martin)을 포함한 유명 작가가 오픈AI를 상대로 집단 소송을 걸었다.

일각에서는 정부 차원에서 AI 규제 강화가 필요하다고 입을 모은다. 챗GPT를 개발한 오픈AI 샘 올트먼(Sam Altman) CEO 역시 지난 5월 열린 상원 사법위원회(Senate Committee on the Judiciary) 청문회에 증인으로 출석해 AI와 관련된 새로운 기관 설립을 제안하며 “AI를 개발하거나 출시하려는 기업에 라이선서를 부여해 안전한 표준을 준수하도록 하자는 것”이라고 강조한 바 있다.

[스타트업투데이=염현주 기자] yhj@startuptoday.kr

염현주 기자

다른기사 보기

상단영역

본문영역

오픈AI, 내달 한층 개선된 ‘달리3’ 출시 예고∙∙∙“정확한 이미지 생성으로 이용자 요구 이해↑”

관련기사

기사 댓글 0

비회원 로그인

본문영역

키워드

관련기사