최근 알리바바가 공개한 이미지 생성 및 편집 통합 모델 WAN2.7-IMAGE가 중국 AI 업계에서 화제를 모으고 있습니다. 이 모델은 기존 AI 생성 이미지의 고질적인 문제였던 ‘천편일률적인 얼굴’과 ‘부자연스러운 색감’을 해결했다고 주장하며, 특히 사람처럼 생생한 이미지 생성 능력을 강조하고 있습니다. 과연 이 기술이 AI 이미지 생성의 새로운 기준을 제시할 수 있을까요?
서비스 사이트 : https://wan.video/

WAN2.7-IMAGE, 무엇이 다른가?
알리바바가 4월 1일 공식 발표한 WAN2.7-IMAGE는 이미지 생성 도구를 넘어 편집까지 통합한 올인원 모델입니다. 이 모델의 가장 큰 특징은 ‘천인천면(千人千面)’, 즉 천 명의 사람이 있으면 천 가지 다른 얼굴을 만들어낼 수 있다는 점이에요.
기존 AI 이미지 생성 도구들은 사용자들 사이에서 ‘심미 피로(審美疲勞)’라는 비판을 받아왔습니다. 쉽게 말해, AI가 만든 얼굴들이 다 비슷비슷하게 느껴진다는 거죠. 특히 눈 모양, 얼굴형, 피부 질감 등이 일정한 패턴으로 반복되면서 ‘이건 AI가 만든 거구나’라는 느낌이 바로 들었습니다.
WAN2.7-IMAGE는 이 문제를 정면으로 공략했습니다. 사용자가 프롬프트(명령어)에서 얼굴형을 지정할 수 있는데요, 계란형, 둥근형, 사각형, 긴 사각형 등 다양한 얼굴형을 선택할 수 있고, 눈 특징도 아몬드형 눈, 깊은 눈두덩이, 둥근 눈, 단봉안(한국에서는 가늘고 긴 눈) 등으로 세밀하게 조정할 수 있습니다. 심지어 골격부터 오관(五官, 눈·코·입·귀·눈썹)의 미세한 부분까지 전방위로 커스터마이징이 가능하다고 하네요.

‘조색판’ 기능으로 색상 제어력 극대화
AI 이미지 생성에서 또 다른 고질적인 문제는 원하는 색감을 정확히 구현하지 못하는 것이었습니다. 사용자가 아무리 상세하게 색상을 설명해도 AI가 엉뚱한 색조로 이미지를 만들어내는 경우가 많았죠.
WAN2.7-IMAGE는 이를 해결하기 위해 ‘조색판(調色盤)’ 기능을 새롭게 지원합니다. 이 기능은 참고 이미지에서 색상과 비율을 원클릭으로 추출하거나, 사용자가 직접 입력할 수 있게 해줍니다. 더 나아가 색상의 개수와 비율을 자유롭게 조절해 맞춤형 배색 방안을 만들 수 있다고 하네요. 디자이너나 마케터들에게는 상당히 유용한 기능이 될 것 같습니다.

3K 토큰 초장문 텍스트 렌더링, A4 용지 한 장 분량 가능
WAN2.7-IMAGE의 또 다른 강점은 텍스트 렌더링 능력입니다. 이 모델은 최대 3K 토큰(token)의 초장문 텍스트 입력을 지원하는데요, 이는 A4 용지 한 장 분량의 논문을 이미지로 출력할 수 있는 수준입니다.
여기서 ‘토큰’이란 AI가 텍스트를 처리할 때 사용하는 최소 단위를 말합니다. 보통 한 단어나 단어의 일부가 하나의 토큰이 되는데, 3K 토큰이면 상당히 긴 문장을 처리할 수 있다는 의미죠. 게다가 12개 언어를 지원하며, 초장문 텍스트, 표, 복잡한 수식까지 인쇄급 품질로 렌더링 할 수 있다고 합니다.
이는 단순히 이미지에 텍스트를 넣는 수준이 아니라, 포스터, 인포그래픽, 학술 자료 등 전문적인 시각 콘텐츠 제작에도 활용할 수 있다는 뜻입니다.

‘어디가 불편하면 그곳을 클릭’ – 원클릭 수정 기능
WAN2.7-IMAGE는 원클릭 수정 기능도 제공합니다. 중국어 원문에서는 “哪里不爽点哪里(어디가 불편하면 그곳을 클릭)”라는 재치 있는 표현을 사용했는데요, 사용자가 이미지에서 수정하고 싶은 부분을 정확히 지정해 편집할 수 있다는 의미입니다.
정밀한 프레임을 통해 지정된 영역에 요소를 추가하거나, 정렬하거나, 이동시키거나, 로고를 삽입하는 등 픽셀 수준의 의도 정렬이 가능하다고 하네요. 이는 기존 AI 이미지 생성 도구들이 ‘전체를 다시 생성’하는 방식에서 벗어나, 부분 편집이 가능해졌다는 점에서 실용성이 크게 향상된 것으로 보입니다.
또한 다중 주체 일관성 기능도 지원하는데, 최대 9장의 이미지를 합성해 영화 포스터나 가구 조합 이미지를 만들 수 있으며, 스타일과 특징의 통일성을 유지할 수 있다고 합니다.

마치며…
요즘 보면 AI 관련 기술들은 미국과 중국이 서로 핑퐁치듯이 새로운 것들을 내놓고 있어 기술 발전 속도가 엄청 빠르게 느껴집니다.
우리나라 입장에서 보면, 중국의 AI 이미지 및 영상 생성 기술이 단순히 기술 시연 수준을 넘어 실제 비즈니스 현장에서 빠르게 적용되고 있다는 점이 주목할 만합니다. 특히 크로스보더 전자상거래, 소셜미디어 마케팅 등 실용적인 영역에서 생산성을 극대화하는 방향으로 발전하고 있어, 우리나라 관련 산업에도 적지 않은 영향을 미칠 것으로 보입니다.
중국의 AI 기술 발전 속도는 분명 놀랍습니다. 하지만 이러한 기술이 실제로 얼마나 안정적이고 범용적으로 활용될 수 있을지, 그리고 데이터 프라이버시나 저작권 문제는 어떻게 해결할지 등은 여전히 지켜봐야 할 부분입니다. 기술의 발전은 환영할 만하지만, 그 이면의 리스크와 한계도 냉철하게 평가할 필요가 있겠습니다.