본문 바로가기
ChatGPT & AI technology

Tiktok 틱톡 AI 기술 알고리즘과 추천프로세스

by Feelbridge 2023. 4. 17.

Tiktok 틱톡, 그리고 AI 기술

틱톡은 중국의 IT기업인 바이트댄스가 출시한 Shortform숏폼 기반의 소셜 미디어로 전 세계에서 150개국 75개 언어로 서비스되고 있는 비디오 스트리밍 앱으로 현재 유튜브이상의 인기를 얻고 있는 애플리케이션이다. 이용자수는 현재 10억 명을 넘어서며 최근 3~4년 동안 급성장을 하였으며 기업가치도 급등하고 있다. 또한 23년 1분기 기준 월평균 이용자 사용자 시간은 24시간으로 유튜브의 23.2를 넘어서면서 최고의 인기 소셜 미디어 플랫폼이 되었습니다. 

처음에는 유튜브의 아성에 곧 잊혀질것이라 생각했지만 이제는 유튜브가 걱정을 해야 하는 상황입니다. 유튜브도 대응책으로 숏츠폼을 내놓았지만 대중은 여전히 틱톡에 빠져있습니다. 그 이면에는 틱톡의 독특한 AI 기술이 적용이 되었다는데 과연 무엇일지 알아보도록 합시다. 

tiktok-logo
tiktok-net-revenue

틱톡 Tiktok의 AI 알고리즘 추천 FYP, FOR YOUR PAGE가 독특한 이유는?

틱톡은 기존 메타의 페이스북, 인스타그램, 유튜브와 유사한 이용자간의 관계망을 기반으로 미디어 환경을 구성하고 있습니다. 틱톡은 여기에 기본적으로 'For your page'라는 추천 피드를 적용하고 있습니다. 이 추천 피드는 AI가 이용자의 미디어 사용 패턴을 실시간 분석하여 피드를 추천하는 방식으로 AI가 이용자에게 콘텐츠를 추천하고 이용자는 콘텐츠를 소비하는 과정에 반응에 따라 노출되는 콘텐츠가 실시간으로 반영이 되게 됩니다. 예를 들어서 AI가 추천하는 콘텐츠를 이용자가 넘기지 않고 지속적으로 체류하면서 보거나 좋아요 표시, 공유, 다운로드를 하게 되는 행위 즉, 긍정의 반응을 보이게 되면 AI는 분석하여서 비슷한 유형의 콘텐츠를 이용자에게 추천하게 됩니다. 반대로 이용자가 체류하지 않고 스킵하거나 아무런 반응이 없다면 추천을 하지 않게 됩니다. 틱톡은 기존의 SNS와 차별화되는 것은 또한 미디어환경에서 즐거운 것을 찾고 콘텐츠를 소비하는 10대, 20대들에게 적극적이고 새로운 경험을 끊임없이 제공한다는 것입니다. 틱톡은 이용자취향에 맞는 다양한 콘텐츠를 지속적으로 제안하고 또한 콘텐츠를 소비하는 거에만 그치지 않고 제작할 수 있게 손쉬운 콘텐츠제작 AI 툴을 제공하여 타 SNS와 극명한 차이를 보이고 성장할 수 있었습니다. 

 

TikTok AI 알고리즘 및 구조원리

TikTok의 에이아이AI 알고리즘은 크게 3가지 블록으로 구성되어 있습니다. 

  1. 자가 학습 AI 엔진

  2. 콘텐츠 태그

  3. 사용자 프로필 및 시나리오

위 엔진 블록 요소간의 상관관계는 데이터, 기능, 참여 메트릭스 및 관리 알고리즘을 그때그때 적용하게 됩니다. 

그리고 알고리즘의 최종 목표는 유저의 앱사용 시간을 최대한 늘리고 콘텐츠를 소비하게 하는 것입니다.

 

1단계 틱톡 AI 알고리즘 및 NLP(자연어처리)

사용자가 콘텐츠를 업로드하면 악의적이거나 민감한 콘텐츠를 제거하기 위해 이중 감사를 거칩니다.
저작권 위반을 표시하는 컴퓨터 비전 기반 엔진에서 사용자 생성 콘텐츠를 검사합니다. 또한 중복 콘텐츠에 대한 트래픽 억제를 수행합니다. 동시에 기계 검토는 NLP를 활용하여 내용을 더 잘 이해하기 위한 필사본을 생성합니다. 마지막으로 콘텐츠가 규칙 및 규정을 준수하는지 확인하기 위해 메타데이터가 고려됩니다.
다음 단계에서는 보고된 콘텐츠에 대한 수동 검토가 수행됩니다. 동영상이 플랫폼 이용 약관을 위반한 것으로 확인되면 삭제됩니다.

 

2단계 틱톡AI 초기 콘텐츠 일괄처리프로세스(Initial Batch Processing)

콘텐츠가 감사를 통과하면 정보 흐름 퍼널로 들어갑니다. 콘텐츠 기능에 따라 노출을 결정하는 콜드 스타트 ​​트래픽 풀에 묶입니다. 이 콜드 스타트는 새로운 사용자나 인플루언서 등 모든 사람이 여기에서 처음부터 시작하므로 공정한 경쟁의 장 역할을 합니다.

3단계: 메트릭 가중 콘텐츠 성능(Metric-Weighted Content Performance)
플랫폼은 초기 트래픽 풀에 콘텐츠를 푸시하여 데이터를 수집하여 시청자 반응을 분석합니다. 이 단계에서 캡처한 주요 메트릭에는 좋아요 수, 고유 조회수, 전체 조회수, 댓글, 재게시, 팔로워 증가, 공유, 다시 보기 등이 포함됩니다. 이러한 입력을 기반으로 추천 엔진은 콘텐츠의 성능을 측정하고 점수를 할당할 수 있습니다

4단계: 피드백 기반 프로필 증폭기(Feedback-Based Profile Amplifier)
이전 단계에서 수집된 피드백을 사용하여 트래픽 풀은 추가 작업 과정에 대한 결정에 도달하기 위해 AI 엔진에서 추가 분석을 거칩니다. 우수한 콘텐츠는 사용자 그룹 및 프로필을 대상으로 더욱 증폭되어 입지를 강화합니다.

5단계: 맞춤형 트렌드 풀(Tailored Trending Pools)
전체 콘텐츠의 1% 미만이 탐나는 트렌드 풀에 포함됩니다. 이러한 콘텐츠는 그 어떤 콘텐츠보다 몇 배나 높은 독보적인 노출도를 자랑합니다. 이러한 최상위 콘텐츠는 사용자 프로필과 관심사에 관계없이 무차별적으로 홍보됩니다. 


6단계: 지연활성화(Delayed Ignition)
TikTok의 AI 기반 워크플로의 또 다른 구성 요소는 지연활성화입니다.

여기에서 기존 콘텐츠를 검토하고 나중에 몇 주 후에 엄청난 폭발력으로 배포, 인기를 얻습니다.

tiktok-ai-algorithm

 

 

 

 틱톡의 이와같은 고도의 AI알고리즘 기술력 적용은 앞으로 유튜브의 아성을 무너뜨릴지 그 귀추가 기대되고 있습니다.

 

 

 

댓글