이미지와 정보량

정보량이라는 개념에 대해 익혀봅시다.

개요

코멧의 일부 캐릭터에서는 "이미지를 수백 장씩 넣었다" 라는 캐릭터가 존재합니다.
분명히 수백 장에 대한 설명을 일일이 넣으면 프롬프트가 넘칠 수밖에 없는데, 어떻게 된 걸까요?

정보량은 문자 그대로, 정보의 양을 의미합니다.
아래 예시를 살펴봅시다.

markdown

- 사과
- 사과
- 사과
- 바나나
- 바나나
- 바나나
- 딸기
- 딸기
- 딸기

여기서 과일의 종류라는 정보가 필요하다고 할 때, 우리는 9개의 데이터가 모두 필요하지 않습니다.
중복되는 데이터를 제거하고 난다면, 정보는 3개만 남게 되므로 우리는 종류가 3개라고 답합니다.

우리가 프롬프트에 필요한 건 이 바구니에 있는 과일의 종류에 가깝습니다.
이 경우, 9개의 정보를 모두 담을 필요 없이 3개의 정보만 담으면 됩니다.

아래와 같이 이미지를 9장 뽑았다고 가정해 보겠습니다.

markdown

- A가 웃는 이미지
- A가 우는 이미지
- A가 화내는 이미지
- B가 웃는 이미지
- B가 우는 이미지
- B가 화내는 이미지
- C가 웃는 이미지
- C가 우는 이미지
- C가 화내는 이미지

이 경우, 우리는 이미지 설명에 대한 정보량을 단 3개로 줄일 수 있습니다.

먼저 중복되지 않는 정보만 파편화하여 추려냅니다. 그렇다면 아래와 같이 6개의 데이터를 추출할 수 있습니다.

markdown

- A
- B
- C
- 웃는 이미지
- 우는 이미지
- 화내는 이미지

여기서 3개를 더 줄이는 방법으로, 캐릭터의 이름 정보까지 모두 날려버립니다.

왜 가능할까요? 이유는 다름아닌, 캐릭터의 이름은 어차피 나중에 나올 것이기 때문입니다.
캐릭터가 존재할 것이므로 이미지가 있을 것입니다. 따라서 중복으로 캐릭터 이름을 명시해줄 필요가 없습니다.

이렇게 설계한다면, 캐릭터가 몇 명이든 상관없이 정보량은 오직 감정 개수에 따라서만 변하게 됩니다.
캐릭터가 많아지면 많아질 수록, 이미지 수에 비해 정보량은 훨씬 적어지니 수백 장의 이미지가 가능한 것입니다.