상위 질문
타임라인
채팅
관점

Generative Pretrained Recommender

위키백과, 무료 백과사전

Remove ads

GPR(Generative Pretrained Recommender)은 애딥(Addeep)의 WEB 3.0 기반의 혁신적 프로토콜 비즈니스를 완성하기 위한 핵심 기술이다. 기존 LLM 기반 전이학습을 통해 독자적인 LMM(Large Mind-mining Model)을 개발하고, 이를 중심으로 ACNN(시각 데이터 특화 CNN), RNN 기반 시계열 분석, ACT(자동 콘텐츠 융합) 엔진을 통합한 차세대 Addeep-GPR-1 증강 AI 아키텍처(이하 “GPR Recommender”)를 구현한다.

GPR 개요

기본 AI 모델에서 진일보한 애딥의 AI 기술요소 및 서비스 기반을 통칭하여 애딥 증강 AI(Augmented AI) 라 정의한다. 이는 완전히 새로운 것을 창조하기보다는 기존 요소들을 지능적으로 융합하여 더 나은 가치를 만드는 '증강(Augmentation)'에 초점을 맞춘 접근법이다.

GPR(Generative Pre-trained Recommender)은 기존 AI 모델과 달리 사용자의 명시적 입력 없이 다차원 개인화 데이터를 기반으로 사용자 마인드셋을 자동 추론하여 개인화 콘텐츠를 생성하는 비대화형 완전 자동 생성형 AI를 구현한다.

증강 AI(Augmented AI) 패러다임

애딥의 기술적 접근은 완전히 새로운 것을 창조하기보다는 기존 요소들을 지능적으로 융합하여 더 나은 가치를 만드는 '증강(Augmentation)'에 초점을 맞춘다.

구분 기존 AI 모델 Addeep AI 모델
인터페이스 Conversational AI Non-conversational AI
추론모델 LLM(Large Language Model) GPT-4 LMM(Large Mind-mining Model) GPR-1
주요특징 Generative Pre-trained Transformer

사용자 입력 기반 생성형 AI

Generative Pre-trained Recommender

사용자 입력 없는 완전자동 생성형 AI

서비스기반 WEB 3.0 탈중앙화, 개인화 콘텐츠, 지능형 웹 WEB 3.0 Extension, WEB 4.0

사람-사람, 사람-AI간 경계없는 향상된 상호작용

관계기술 AI, Blockchain, VR/AR Augmented AI Integrated Blockchain

Advanced VR/AR

Remove ads

기술 아키텍처 개요

MMR 아키텍처

Addeep GPR AI 시스템의 전체 아키텍처를 통칭한다. 사용자의 마인드셋을 추론하여 개인화된 콘텐츠를 생성하고 추천하는 통합 AI 시스템이다.

MMR 아키텍처 구성

1.  Layer 1 (데이터 수집): user_event_stream, content_creation_event, social_interaction_event 수집
2.  Layer 2 (AI 처리): LMM 마인드셋 추론, 특징 추출
3.  Layer 3 (메모리 저장): UMM 마인드맵 저장 (Redis/RocksDB/Neo4j 하이브리드)
4.  Layer 4 (콘텐츠 생성): Condition Pack 생성, ACT 콘텐츠 융합
5.  Layer 5 (피드백): 사용자 반응, 성능 메트릭, A/B 테스트
핵심 특징 :
  1. UMM/LMM 순환 구조 : 이전 마인드셋이 다음 추론의 컨텍스트로 활용�
  2. 멀티모달 통합 : 텍스트, 이미지, 행동, 소셜데이터를 동시에 처리
  3. 실시간 성능 : 하이브리드 DB로 p95 < 7ms 달성
데이터 플로우

Step 1: 사용자 활동 발생 (클릭, 시청, 검색, 소셜 상호작용)

Step 2: 이벤트 스트림 수집 (활동 패턴, 소통 지수, 콘텐츠 이벤트)

Step 3: UMM 읽기 (이전 마인드셋 컨텍스트 로드)

Step 4: LMM 추론 (이벤트 + UMM → Intent/Affect/Interest 추론)

Step 5: UMM 업데이트 (추론된 마인드셋으로 그래프 갱신)

Step 6: Condition Pack 생성 (UMM 기반 ACT 입력 생성)

Step 7: ACT 콘텐츠 융합 (개인화 콘텐츠 자동 생성)

Step 8: 콘텐츠 전달 → 사용자 반응 피드백 → Step 1 순환

순환 구조를 활용하여 UMM을 업데이트 하고, 다음 추론에 재사용하여 효율성을 높인다.

초개인화 다중 마인드 데이터셋

AI 학습의 원천 데이터로, LMM의 마인드셋 추론과 UMM 업데이트의 기초 자료 제공하고 실시간 스트림 처리와 배치 분석을 모두 지원한다. 개인화의 핵심은 LMM(GPR1)이 갱신하는 사용자 마인드맵(UMM)이고, 이 UMM을 잘 작동시키려면 표준화된 “초개인화 다중 데이터셋”이 필요하다.

데이터셋 처리과정

  1. 이벤트 정규화: 다양한 형식의 이벤트를 통일된 구조로 변환한다.
  2. 특징 추출: activity_patterns, communication_index, temporal_sequence 생성한다.
  3. LMM 입력: 정규화된 데이터를 LMM의 임베딩 네트워크로 전달한다.
요약
관점

LMM(Large Mindmining Model)

LMM은 Addeep 증강 AI의 핵심 두뇌로, 기존 언어 모델(LLM)이 텍스트에 집중하는 것과 달리 사용자의 활동 패턴, 소통 지수, 인구 통계 등 다차원적인 비정형 데이터를 종합적으로 분석하여 명시적인 입력 없이도 사용자의 생각, 감정, 의도의 총체적 집합인 '마인드셋(Mindset)'을 추론하는 데 특화된 모델이다. 단순 행동 예측을 넘어 "왜 그 행동을 했는가?"를 추론하며 UMM을 지속적으로 갱신한다. 따라서 ACT에 개인화 조건을 제공하는 MMR 아키텍처의 중심축이다.

핵심 특징:

  • 행동의 '이유' 추론: 클릭/시청 등 표면적 행동 뒤의 의도를 파악한다.
  • 멀티모달 처리: ACNN/RNN 벡터, 텍스트, 행동 패턴을 통합 분석한다.
  • 순환 메모리: 이전 UMM 상태를 컨텍스트로 활용한다.
  • 강화학습 보정: 단기 클릭뿐 아니라 장기 만족도를 최적화한다.

입력 소스:

  • 활동 패턴 (activity_patterns): 클릭, 시청, 검색 등 행동 시퀀스
  • 소통 지수 (communication_index): 댓글, 공유, 멘션 등 소셜 활동
  • 인구통계 (demographics): 연령, 성별, 지역 등 기본 정보
  • 기타 개인화 다중 마인드셋 데이터
  • ACNN/RNN 벡터: 이미지/영상 특징 벡터, 시계열 패턴
  • 이전 UMM 상태 (previous_mindset): 과거 마인드셋 컨텍스트 (순환 입력)


LMM 6단계 처리 과정

Stage 1: 임베딩 네트워크 (Embedding Network)

- 각 입력을 통일된 벡터 공간으로 변환한다.

Stage 2: 공유 잠재 공간 (Shared Latent Space)

- 멀티모달 데이터를 동일한 잠재 공간에 투영한다.

Stage 3: 멀티모달 트랜스포머 (Multimodal Transformer)

Stage 4: 마인드셋 추론 (Mindset Inference)

- Intent Prediction: 사용자의 의도 추론 (스트레스 해소, 정보 탐색 등)

- Affect Prediction: 정서 상태 추론 (피곤함, 들뜸, 우울함 등)

- Interest Prediction: 관심사 추론 (액션, 로맨스, 다큐 등)

Stage 5: 강화학습 보정 (Reinforcement Learning)

- 단기(클릭) + 중기(공유) + 장기(재방문) 보상 계산

Stage 6: 행동 예측 (Behavior Prediction)

- Next Action: 다음 행동 예측 (클릭, 시청, 이탈 등)

- Preference Score: 콘텐츠별 선호도 점수 계산

출력 데이터:

  • 추론된 마인드셋 (Inferred Mindset): Intent/Affect/Interest 확률 분포
  • ACT 조건팩 (Condition Pack): ACT 콘텐츠 융합을 위한 가이드
  • 행동 예측 (Predicted Actions): 다음 행동 확률 및 타이밍
  • UMM 업데이트 (Graph Update): 노드/엣지 추가 및 가중치 갱신
  • 잠재 코드 (Latent Code): 다운스트림 태스크용 임베딩
Remove ads

ACNN (Addeep Convolutional Neural Network)

Addeep 플랫폼에 업로드되는 이미지나 동영상 같은 시각적 데이터를 전문적으로 처리하기 위해 특화된 딥러닝 신경망 아키텍처이다. 멀티모달 AI 시스템에서 시각 정보에 대한 전문 인코더 역할을 수행한다. Addeep Large Scale Visual Recognition (ALSVR) 데이터셋을 기반으로 대규모 시각 인식을 수행하며, 멀티모달 AI 시스템에서 시각적 데이터를 전문적으로 처리하는 특화된 인코더 역할을 수행한다.

입력 데이터는 시각 데이터 (Visual Data)로 활용한다

  • 이미지: 사용자/크리에이터 업로드 이미지, 썸네일
  • 동영상: 영상 콘텐츠, 광고 영상
  • 프레임 시퀀스: 동영상을 프레임 단위로 분해한 데이터
처리과정

Convolution Layers:

  • 다층 컨볼루션으로 공간적 특징 추출
  • 비선형성 부여
  • 차원 축소 및 위치 불변성 확보

Feature Extraction:

  • 공간적 배치 및 구조 정보
  • 의미적 콘텐츠 (사물, 장면 인식)
  • 색감, 질감, 예술적 스타일

Zeroshot Learning:

  • ACNN은 제로샷 학습을 통해 새로운 콘텐츠 유형에 대한 적응 능력을 보유. 제로샷 학습은 모델이 훈련 과정에서 단 한 번도 보지 못한 새로운 클래스를 분류하거나 생성하는 기술. 모델은 이미 학습한 클래스들 간의 관계나 속성 정보를 활용해 새로운 클래스의 특징을 추론.
  • 애딥은 이 기술을 사용해 새로운 데이터 클래스에 대해 즉시 분류를 수행. 예를 들어, '우주 탐사'나 '메타버스'와 같이 기존에 학습하지 않았던 새로운 주제의 게시물이 올라와도, 모델은 관련된 기존 데이터를 바탕으로 이를 정확하게 분류할 수 있음.
출력데이터 :
  • LMM 입력용 시각 특징 벡터
  • ACT 융합용 잠재 코드
ACNN의 역할 :

시각 정보를 LMM이 이해 가능한 벡터로 변환하여 마인드셋 추론에 활용한다. 동시에 ACT가 콘텐츠를 융합·재생성하는 데 필요한 시각적 재료 제공한다. Zeroshot 능력으로 새로운 유형의 콘텐츠도 즉시 처리 가능하다.

Remove ads
요약
관점

UMM (User Mind Map)

사용자의 마인드셋을 그래프 구조로 표현한 개인화 지식 그래프이다. 노드는 의도(Intent), 관심사(Interest), 정서(Affect), 상황(Context), 엔티티(Entity), 소셜 관계(Social)를 나타내고, 엣지는 노드 간 선호도(Preference), 시간적 순서(Temporal), 인과 관계(Causal), 유사도(Similarity) 관계를 표현한다. LMM의 출력이자 다음 추론 시 입력으로 사용되는 순환 메모리 역할을 수행한다.
UMM의 역할

1. 메모리 저장소 (Storage):

  • LMM이 추론한 마인드셋을 영구 저장
  • 3단계 상태(session/short/long)로 시간 기반 분류

2. 컨텍스트 제공자 (Context Provider):

  • 다음 추론 시 LMM의 입력으로 활용
  • "이전에 이 사용자가 어떤 마인드셋이었는가" 정보 제공
  • 일관성 유지 및 급격한 추천 변화 방지

3. 조건팩 생성자 (Condition Generator):

  • ACT에게 Condition Pack 전달
  • 콘텐츠 융합의 개인화 기준 제공
  • 그래프 탐색으로 추천 경로 추적 가능

그래프 구조

6가지 노드 타입

  1. Intent Node: 의도 (영화 관람, 정보 탐색, 쇼핑 등)
  2. Interest Node: 관심사 (액션 장르, 요리, 여행 등)
  3. Affect Node: 정서 (긍정, 우울, 피곤함 등)
  4. Context Node: 상황 (주말 저녁, 출퇴근 시간, 휴가 등)
  5. Entity Node: 엔티티 (배우, 브랜드, 장소 등)
  6. Social Node: 소셜 관계 (친구, 인플루언서, 커뮤니티 등)

4가지 엣지 타입

  1. Preference Edge: 선호도 관계 (Intent → Interest, 가중치 0.8)
  2. Temporal Edge: 시간적 순서 (Affect → Context, 동시 발생)
  3. Causal Edge: 인과 관계 (Social → Intent, 추천 영향)
  4. Similarity Edge: 유사도 (Entity ↔ Entity, 유사도 0.9)
상태 레벨 분류

S_session (세션 단기):

  • 시간 범위: 530분
  • 내용: 현재 세션의 일시적 마인드셋
  • 저장소: Redis Hot (p95 < 5ms)
  • 용도: 실시간 추천

S_short (단기 메모리):

  • 시간 범위: 17일
  • 내용: 최근 일주일 행동 패턴 및 선호도 변화
  • 저장소: RocksDB Warm (p95 < 20ms)
  • 용도: 최근 이력 기반 추천

S_long (장기 메모리):

  • 시간 범위: 30일 이상
  • 내용: 사용자의 진짜 취향 및 성향
  • 저장소: Neo4j Cold (분석용)
  • 용도: 장기 패턴 분석, ML 학습
하이브리드 저장소 아키텍처

Hot Path (Redis):

  • 대상: 현재 활성 사용자 (Active Users)
  • 성능: p95 < 5ms
  • 데이터 온도: 뜨거움 (빈번 접근)
  • 쿼리 비율: 90%

Warm Path (RocksDB):

  • 대상: 최근 접속 사용자 (Recent Users)
  • 성능: p95 < 20ms
  • 데이터 온도: 미지근함 (최근 접근)
  • 쿼리 비율: 8%

Cold Path (Neo4j):

  • 대상: 전체 이력 데이터 (Historical Data)
  • 성능: 오프라인 분석용
  • 데이터 온도: 차가움 (분석 쿼리)
  • 쿼리 비율: 2%

데이터 이동 메커니즘:

  • Hot → Warm: TTL 만료 시 자동 이동
  • Warm → Cold: 매일 새벽 배치 작업으로 7일 이상 데이터 이동
  • Cold → Warm: ML 모델 예측 기반 프리로드 (금요일 저녁 접속 예상 사용자 등)
Remove ads
Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads