AI 자체기사 AI이해 임베딩 벡터

AI는 글을 왜 숫자로 바꿀까: 뜻을 계산 가능한 형태로 만드는 법

1 조회

핵심 요약

컴퓨터는 글의 뜻을 직접 만질 수 없기 때문에, 글을 먼저 숫자로 바꿔야 한다. 이 과정에서 단어와 문장은 토큰과 벡터 같은 계산 가능한 형태로 변환된다. AI가 글을 이해하는 것처럼 보이는 이유도 사실은 이 숫자화 과정을 거치기 때문이다.

Why It Matters

임베딩, 벡터, 토큰 같은 말이 낯설어도 핵심은 단순하다. 컴퓨터는 숫자만 계산할 수 있기 때문에 의미도 숫자 표현으로 바꿔야 한다는 점이다. 이 원리를 알면 왜 AI 검색, 추천, 요약이 모두 숫자 공간 위에서 움직이는지 이해가 쉬워진다.

컴퓨터는 글의 뜻을 손으로 만지듯 다룰 수 없다

사람은 글을 글로 읽는다. 문장을 보면 의미를 떠올리고, 단어 사이의 관계를 감으로 파악한다. 하지만 컴퓨터는 글을 그대로 붙잡고 계산할 수 없다. 컴퓨터가 다룰 수 있는 것은 결국 숫자다. 그래서 AI가 글을 이해하려면, 먼저 글을 숫자로 바꾸는 과정이 필요하다.

이상하게 들릴 수 있다. “글은 글인데 왜 숫자로 바꿔?”라고 묻게 된다. 이유는 단순하다. 계산은 숫자로 해야 하기 때문이다. 컴퓨터는 두 문장이 비슷한지, 어떤 문서가 더 관련 있는지 판단할 때 내부적으로 숫자 연산을 한다.

문자를 숫자로 바꾸는 것만으로는 부족하다

우리가 쓰는 한글, 영어, 숫자, 기호는 컴퓨터 안에서 각기 다른 숫자 코드로 표현된다. 하지만 여기까지만으로는 부족하다. 글자를 숫자로 바꿨다고 해서 뜻이 생기지는 않기 때문이다. “사과”와 “배”가 코드상으로 가까이 있다고 해서 과일이라는 공통점을 이해하는 것은 아니다.

그래서 AI는 더 나아간 표현을 쓴다. 바로 임베딩이다. 임베딩은 단어, 문장, 문서를 단순 코드가 아니라 “뜻의 특징이 담긴 숫자 묶음”으로 바꾸는 방법이다. 장소 이름을 지도 위 좌표로 찍는 것과 비슷하게, 문장도 AI 안에서는 어떤 숫자 공간의 한 점처럼 표현된다.

벡터는 문장의 뜻을 담은 숫자 묶음이다

중요한 것은 숫자 하나가 아니라 숫자들의 묶음이라는 점이다. 문장 하나가 길고 복잡할수록, 그 뜻을 한 자리 숫자로 표현할 수는 없다. 대신 수백 개, 수천 개의 숫자가 함께 그 문장의 특징을 담는다. 이 숫자 묶음을 벡터라고 부른다.

왜 이렇게까지 하느냐면, 그래야 비슷한 뜻을 비교할 수 있기 때문이다. 예를 들어 “청년 일자리 지원 정책”과 “청년 고용 대책”은 글자가 똑같지 않아도 비슷한 주제를 담고 있다. AI는 이런 차이를 눈으로 보는 대신 숫자 벡터 사이의 패턴으로 판단한다.

한 줄로 정리하면

AI는 글을 곧바로 이해하는 것이 아니라, 먼저 뜻의 특징이 담긴 숫자 벡터로 바꾼 뒤 계산한다. 읽기처럼 보이는 일의 바닥에는 사실 변환이 먼저 있다.

다음 편 예고

다음 글에서는 AI가 이 숫자 벡터들을 가지고 어떻게 “비슷하다”와 “멀다”를 계산하는지, 연관성의 원리를 다룹니다.

Next Step

이 글을 읽은 뒤 바로 이어볼 수 있는 추천

더 읽기로 감을 넓히고, 사례를 본 뒤, 필요하면 참여나 도구로 넘어가면 됩니다.

더 읽기

소셜섹터를 위한 AI 기본법 완전 해설

법과 정책 변화가 도입 체크리스트에 어떤 영향을 주는지 함께 보면 판단이 빨라집니다.

관련 글 보기
함께 배우기

소셜섹터 AI 리터러시 기초 과정

도입 전 체크리스트를 팀 단위 의사결정으로 연결하는 가장 빠른 입문 경로입니다.

워크숍 보기
자료·도구

NGO 실무자 AI 첫걸음 가이드북

조직에 맞는 적용 예시와 위험 관리 포인트를 문서 형태로 바로 참고할 수 있습니다.

상품 보기

다음 행동

읽고 끝내지 않도록 다음 콘텐츠를 바로 연결합니다.

댓글 (0)

아직 댓글이 없습니다. 첫 댓글을 작성해보세요!

뉴스레터 전환

이 주제의 다음 기사와 참여 기회를 먼저 받으세요.

관련 기사, 사례, 행사 소식을 묶어서 보내드립니다. 기사 하나를 읽고 끝나는 경험이 아니라, 조금씩 더 깊게 들어갈 수 있게 이어 붙였습니다.