AI 이미지 전쟁의 새로운 국면을 열다

최근 인공지능(AI) 이미지 생성 시장에서 새로운 변화를 불러오고 있는 오픈AI의 ‘챗GPT 이미지 2.0’이 공개됐다. 이 모델은 ‘덕테이프(Duct Tape)’라는 코드명으로 알려진 새로운 이미지 생성 모델로, 지브리 풍 이미지의 유행에 힘입어 경쟁이 치열해진 이 시장에서 오픈AI가 다시 한번 반격에 나선 모습이다.

챗GPT 이미지 2.0은 21일(현지시간) 정식 출시되었으며, 이전 모델인 ‘이미지젠 2.0’을 기반으로 하고 있다. 이 새로운 모델은 AI 평가 플랫폼 아레나에서 좋은 평을 받은 덕테이프의 정식 버전으로, 특히 ‘사고(Thinking)’ 기능을 탑재한 것이 큰 특징이다. 이 기능을 활성화하면 사용자는 웹 검색을 통해 최신 정보를 반영하거나, 단일 프롬프트로 최대 8개의 서로 다른 이미지를 동시에 생성할 수 있다. 이러한 기능은 특히 만화 페이지나 소셜 그래픽 세트, 브랜드 포스터 등에서 인물이나 캐릭터의 일관성을 유지하는 데 도움을 준다.

챗GPT 이미지 2.0은 세밀한 지시 수행과 물체 배치 정확도, 밀집 텍스트 렌더링에서 이전 세대에 비해 현저한 성능 향상을 보여준다. 최대 2K 해상도를 지원하며, 다양한 비율의 이미지를 생성하여 배너, 포스터, 소셜 그래픽 등 실무에 바로 적용할 수 있는 포맷을 제공한다.

또한, 다국어 지원이 강화되어 일본어, 한국어, 중국어, 힌디어, 벵골어 등 비라틴 문자권 언어에서도 자연스러운 텍스트 흐름을 반영한 이미지를 생성할 수 있도록 했다. 이러한 변화는 다양한 문화와 언어를 가진 사용자들에게 보다 접근하기 쉬운 이미지 생성 경험을 제공할 것으로 기대된다.

이 모델은 이날부터 모든 챗GPT 및 코딩 에이전트 사용자에게 제공되며, 사고 기능을 활용한 고급 출력은 챗GPT 플러스, 프로, 비즈니스 사용자에게만 제공된다. 개발자들은 API를 통해 ‘gpt-이미지-2’ 모델을 사용하여 자사 제품에 이 기능을 통합할 수 있다. 가격은 선택한 품질과 해상도에 따라 달라진다.

AI 이미지 생성 시장은 이제 단순한 신모델 출시를 넘어, 플랫폼 전략 경쟁으로 발전하고 있다. 지난해 지브리 풍 이미지 열풍이 대중의 관심을 끌면서 AI 이미지 생성 기술이 놀이를 넘어 본격적인 비즈니스 경쟁의 장으로 진입한 것이다. 구글은 나노바나나의 후속작인 나노바나나2를 통해 고품질 추론과 빠른 생성 속도를 결합한 이미지 생성 및 편집 도구를 선보였으며, 어도비는 포토샵 AI 어시스턴트와 파이어플라이 이미지 에디터를 강화하고, 크리에이티브 클라우드 앱 전체를 대화형 인터페이스로 제어하는 ‘파이어플라이 AI 어시스턴트’를 발표했다. 이러한 전략들은 각 기업이 자사 모델만으로 경쟁하기보다는 경쟁사 모델을 흡수하여 크리에이터 워크플로의 허브로 자리매김하겠다는 의도를 드러낸다.

각사의 방향성 또한 흥미롭다. 오픈AI는 소비자 경험을 중시하며, 구글은 속도와 성능을 강조하고, 어도비는 크리에이터 친화적 워크플로와 상업적 안전성을 중심으로 발전해 나가고 있다. 이러한 경쟁은 단순히 이미지 품질을 넘어 텍스트 정확성, 편집 일관성, 속도, 상업적 활용성을 포함한 다양한 측면으로 확대되고 있다.

오픈AI는 공식 페이지를 통해 ‘이미지는 장식이 아닌 하나의 언어’라며, 아이디어를 이해하고 공유할 수 있는 결과물로 전환하는 데 도움을 주겠다는 다짐을 밝혔다. 또한, 기능과 위험이 진화함에 따라 지속적인 보호 조치를 강화할 것이라고 강조했다.

이와 같은 변화는 AI 이미지 생성 시장의 미래를 더욱 밝고 다양하게 만들어 줄 것이며, 앞으로의 발전이 기대된다.

AI 이미지 전쟁의 새로운 국면을 열다

코멘트

답글 남기기 응답 취소