Platform Layers · 8 layers, one core

★ ENGINEERING ROADMAP · WORKSTREAMS

qgen-ai에서 지금 무엇이 굴러가는지.

엔지니어링 워크스트림은 qgen-ai 마이크로서비스의 INDEX 보드와 동기화됩니다. 마케팅 약속이 아니라 공학 일정.

CUREA · WORKSTREAMS · QGEN-AI§ ENGINEERING ROADMAP · LIVE

4Shipped

2Implementing

5Planned

Wave 1Active wave

§ Wave 0Wave 0 · 즉시의존 없음

core-infraSHIPPED

domain/shareddomain/core

taxonomySHIPPED

domain/generationdomain/batchdomain/qc

Alembic 9 테이블

data-flywheelSHIPPED

domain/generationdomain/qc

flywheel_events 표준

generation-strategySHIPPED

domain/generation

§ Wave 1Wave 1 · 진행 중Wave 0 후 · 4개 동시

generation-engineIMPL

● ACTIVE PR

domain/generation

복수 결정 진행 중

model-evalIMPL

● ACTIVE PR

domain/model_eval

qc · 세 도장PLANNED

domain/qc

AI · HUMAN · RLHF × 5축

CLC 인제스트PLANNED

domain/shared

원천 → 통일 스키마

§ Wave 2Wave 2 · 예정Wave 1 후 · 2개

콘텐츠 인벤토리PLANNED

domain/generationdomain/qc

실패 복구 라인PLANNED

domain/qcdomain/shared

§ Wave 3Wave 3 · 마지막운영 보드

에듀테크 성능 보드PLANNED

domain/model_evaldomain/shared

§ TRANSPARENCY엔지니어링 워크스트림은 qgen-ai/docs/INDEX.md 의 PR · Phase 매핑과 동기화됩니다. 마케팅 약속이 아니라 공학 일정.

01 · ENGINE

QGen Engine

QGen 엔진

하나의 엔진, 어떤 모델이든, 어떤 과목이든.

Subject-agnostic. Model-agnostic. Korean-first. Curea의 모든 문제 · 해설 · 변형이 통과하는 파이프라인. Python 3.12 + FastAPI + LangChain + SQLAlchemy 2.0 async 위에 7개 도메인 (generation · batch · qc · embedding · media · shared · model_eval) 이 Clean Architecture 4-layer 로 분리되어 작동합니다. Stamp 1 · Stamp 2 · 교사 도장 통과 후에만 학생에게 도달.

Domains

gen · batch · qc · embed · media · shared · eval

Layers

api → app → domain → infra

Active models

25+

2026.05 verified · 0 deprecated

Vendor lock-in

all stages routable

CUREA · DIAGRAM§ PIPELINE · 7 STAGES · STATE MACHINE

§ 01

컨텍스트

CONTEXT

§ 02

초안

DRAFT

§ 03

형식 검증

TIER-1 VALIDATE

§ 04

판정

TIER-2 JUDGE

§ 05

난이도 채점

DIFFICULTY

§ 06

재시도

REVISE

§ 07

저장

PERSIST

§ HARD GATE세 도장 중 하나라도 실패 → Retry 또는 Archive. 도장이 덜 찍힌 채로 다음 단계로 넘어가는 경로는 없습니다.

§ Plain · 쉬운 버전

For teachers, parents, students, journalists

AI에게 자기가 만든 문제를 검수하라고 시키면, 자기 실수를 스스로 눈감아줍니다.— Curea Engineering

AI 하나에게 시험 문제를 통째로 맡기면, 그 AI가 잘 모르는 부분에서 조용히 틀립니다. 더 큰 문제는 — 그 AI에게 자기가 만든 문제를 검수하라고 시키면, 자기 실수를 스스로 눈감아줍니다.

Curea는 그래서 단계마다 다른 AI를 씁니다. 문제를 처음 만드는 AI와 그 문제를 의심하는 AI를 분리하고, 가능하면 서로 다른 벤더나 모델 계열을 배치합니다. 생성 라인의 모델군과 검증 라인의 모델군이 의도적으로 분리되어, 두 라인이 같은 판단 편향을 공유하지 않도록 설계합니다.

§ Technical · 기술 버전

For engineers, investors, technical reviewers

§ 01CROSS-VENDOR QC교차 벤더 검증

단일 모델이 생성과 검증을 겸하면 self-bias가 발생합니다. Curea는 생성 단계와 판정 단계를 분리하고, 판정 특성이 다른 모델 패밀리를 의도적으로 섞어 blind spot을 줄입니다.

§ 02PER-STAGE TIERED ROUTING단계별 계층 라우팅

빠르고 많이 vs. 느려도 정확. 한 모델이 이 스펙트럼 전체에서 최적일 수 없습니다. AWS Step Functions 기반 상태 기반 워크플로가 단계 전이를 제어하고, 단계마다 맞는 모델이나 프로바이더를 호출합니다.

§ 03PROVIDER PATTERN프로바이더 패턴

ABC 베이스 + @lru_cache 싱글톤 위에 실시간 호출은 LangChain, Batch API는 공식 SDK, 이미지·TTS·임베딩이 동일 인터페이스로 다뤄집니다. 어떤 벤더가 어느 단계를 맡고 있는지는 운영 팀이 분기마다 재평가. 모델은 고정 자산이 아니라 교체 가능한 실행 슬롯입니다.

§ 04CLEAN ARCHITECTURE · 4 LAYERSClean Architecture · 4 레이어

api → application → domain → infrastructure 단방향 의존. 도메인이 인프라를 import 하는 것은 정방향, 그 반대는 금지. 7개 도메인 (generation · batch · qc · embedding · media · shared · model_eval) 이 각각 Controller · UseCase · Service · Provider/Repository 패턴으로 분리되어, 모델·DB·외부 SaaS 교체가 도메인 코드에 영향 없이 가능합니다.

도메인 × 책임 · qgen-ai 마이크로서비스

domain/generation

실시간 LLM · LangChain

문제·지문·해설 실시간 생성. State Machine 오케스트레이션

domain/batch

Batch API · 공식 SDK

Inventory-First 대량 생산. 50% 단가 절감

domain/qc

세 도장 검증

AI · HUMAN · RLHF × 5차원 매트릭스 (Wave 1)

domain/embedding

OpenAI · Vector DB

RAG · 재고 검색 · 유사 문항 추천

domain/media

Image · TTS Provider

다이어그램 자동 생성 · 듣기 평가 음성 합성

domain/model_eval

Auto fit + Human RLHF

신규 모델 자동 적합성 평가 + 인간 피드백

infra/persistence

PostgreSQL · Supabase

SQLAlchemy 2.0 async + asyncpg, port 6543 transaction mode

★ DEPENDENCY · 7 DOMAINS

7개 도메인이 어떻게 연결되는가.

CUREA · DIAGRAM · QGEN-AI§ 7 DOMAINS · CLEAN ARCHITECTURE

domain/generation실시간 LLM
domain/batchBatch API
domain/qc세 도장 검증
domain/embeddingRAG · 임베딩
domain/media이미지 · TTS
domain/shared프롬프트 · 파싱
domain/model_evalRLHF · 평가

§ DEPENDENCY실선 = 직접 호출 · 점선 = shared util 의존. Clean Architecture 단방향 규칙 — domain은 infra를 호출, infra는 domain을 모름.

★ MODEL OPS · ROUTING · TIMELINE · LINEUP

지금 어떤 모델이, 어디서, 어떻게 돌고 있는가.

Provider 패턴 위에 어떤 모델이든 교체 가능. 2026.05.25 기준, deprecated 모델은 단 한 개도 라인업에 없습니다. 라우팅 · 출시 속도 · 전체 라인업을 한 흐름으로 보여드립니다.

§ NDA · PARTNER ACCESS모델 라우팅 · 벤더 매핑

공개 다이어그램은 tier 카테고리(frontier · fast · open · sovereign)로 일반화되어 있습니다. 정확한 stage→ 벤더→모델 매핑은 파트너 NDA 후 공개됩니다.

NDA 요청 →

CUREA · MODEL ROUTING · qgen-ai PROD§ 10 STAGES · MULTI-VENDOR FALLBACK

§ 01입력 · 시드INPUT · SEED

OPENAIAPI contract · Pydantic v2★ ACTIVE

강사 · 출판사 · 시스템이 출제 의도 + 메타를 입력

§ 02생성GENERATION

OPENAIFast · 균형 벤더 ★★ ACTIVE

실시간 문항·해설·변형 생성. 한국어 우선 라인은 sovereign 라우팅.

↳ Fallback / Routable

Frontier · 벤더 ASovereign · 한국Open · MoE

§ 03도장 1 · 형식STAMP 1 · FORMAT

OPENAIFast · 저지연 벤더 ★★ ACTIVE

저비용 모델이 형식·중복·지문-선지 정합성 검사. 전량 호출.

↳ Fallback / Routable

Fast Lite · 벤더 BInstant · 벤더 A

§ 04도장 2 · 교차 벤더STAMP 2 · CROSS-VENDOR

OPENAIFrontier · 독립 벤더 ★★ ACTIVE

생성 라인과 의도적으로 다른 벤더가 critique · 난이도 · 적절성 판정. 벤더 분리 원칙.

↳ Fallback / Routable

Frontier · 벤더 BFrontier · Pro 옵션Open Frontier

§ 05임베딩EMBEDDING

OPENAIEmbedding 벤더 ★★ ACTIVE

RAG 검색 · 재고 매칭 · 유사 문항 탐지.

↳ Fallback / Routable

Open embed

§ 06미디어 · 이미지MEDIA · IMAGE

OPENAIImage API ★★ ACTIVE

다이어그램 · 도형 · 삽화 생성.

§ 07미디어 · TTSMEDIA · TTS

GOOGLETTS 벤더 ★★ ACTIVE

듣기 평가용 자연 음성 합성.

§ 08배치 · 대량 생산BATCH · INVENTORY

DEEPSEEKOpen · 저비용 ★★ ACTIVE

Inventory-First 사전 생성. 단가 절감 라인.

↳ Fallback / Routable

Open · MetaOpen · Alibaba

§ 09도장 3 · 교사STAMP 3 · HUMAN

NAVERVerified teacher pool★ ACTIVE

검증 교사가 최종 승인. 거절 시 재생성 루프.

§ 10영속화PERSIST

OPENAIPostgreSQL · 한국 리전★ ACTIVE

Content Grid (PostgreSQL) 입성. flywheel_events 적재.

§ PROVIDER PATTERN★ ACTIVE = 현재 운영 라인. Fallback = 동일 ABC 인터페이스 위에서 호출 라우팅이 이동 가능한 후보. 단계 어디든 24시간 내 모델 교체 가능. 생성·검증 벤더는 의도적으로 분리.

CUREA · MODEL TIMELINE · 2025.Q4 → 2026.Q2§ RELEASES · DEPRECATIONS · ADOPTION

ANTHROPIC

Claude Haiku 4.5

저지연 라인

GOOGLE

Gemini 3 Flash

2.5 Flash 후속

ANTHROPIC

Claude Sonnet 4.6

엔터프라이즈 기본

OPENAI⊘ DEPR

GPT-4o · 4.1 retired

2026.02.13

GOOGLE

Gemini 3.1 Flash Lite

OPENAI⊘ DEPR

GPT-5.1 retired

2026.03.11

ANTHROPIC

Claude Opus 4.7

xhigh effort

DEEPSEEK

DeepSeek V4 Pro

MIT · 오픈 프런티어

GPT-5.5

2026.04.231M ctxproprietary

Agentic 코딩 Terminal-Bench 82.7% · GDPval 84.9%. API 1M 컨텍스트.

OPENAILIVE

GPT-5.4 Pro

2026.04400K ctxproprietary

깊은 추론 + Pro/Enterprise 전용. 사고 시간 옵션.

ANTHROPICLIVE

Claude Opus 4.7

2026.04.16200K ctxproprietary

자체 출력 검증 · 지시 정확도 · xhigh effort. 이미지 해상도 3배.

GOOGLELIVE

Gemini 3 Pro

2025.11.181M ctxproprietary

수학 · 코딩 SOTA. 1M 컨텍스트 (Vertex AI Enterprise 2M).

§ FAST · EFFICIENT빠른 · 비용 효율저지연 · 대량 처리 · 운영6 models

ANTHROPICLIVE

Claude Sonnet 4.6

2026.02.17200K ctxproprietary

엔터프라이즈 API 기본 — 개발 · 분석 · 작문 균형.

ANTHROPICLIVE

Claude Haiku 4.5

2025.10.15200K ctxproprietary

고동시성 · 저지연 · 비용 민감 작업.

GOOGLELIVE

Gemini 3 Flash

2025.12.171M ctxproprietary

프런티어급 속도. 2.5 Flash 후속.

GOOGLELIVE

Gemini 3.5 Flash

2026.021M ctxproprietary

고난도 작업을 빠르게 · 프런티어급 지능 + 속도.

GOOGLELIVE

Gemini 3.1 Flash Lite

2026.03.031M ctxproprietary

최저 비용 · 대량 처리.

OPENAILIVE

GPT-5.3 Instant

2026.03128K ctxproprietary

ChatGPT 무료 티어 기본 · 빠른 응답.

§ OPEN SOURCE오픈 소스자체 호스팅 · sovereign · 라이선스 명확8 models

DEEPSEEKLIVE

DeepSeek V3.2

2025.Q4128K ctxMIT

MoE 671B · 37B active. MMLU 94.2% (GPT-4o 동등). 검증된 오픈 프런티어.

DEEPSEEKPREVIEW

DeepSeek V4 (Preview)

2026.Q11M ctxMIT

~1T MoE · ~32B active · 멀티모달 네이티브 · 1M 컨텍스트.

METALIVE

Llama 4 Scout

2025.0410M ctxcustom

10M 컨텍스트 — 코드베이스 규모 RAG.

METALIVE

Llama 4 Maverick

2025.04custom

저비용 토큰 단가 · 대규모 배포.

ALIBABALIVE

Qwen 3.5

2026.04Apache-2.0

비용 · 개방성 SOTA. 다국어 · 코딩 강력.

MISTRALLIVE

Mistral Medium 3.5

2026.04.29custom

EU 친화 · SWE-Bench 77.6% 코딩 픽.

GOOGLELIVE

Gemma 4

2026.04custom

온디바이스 배포 · 모바일 추론.

MOONSHOTLIVE

Kimi K2.6 Thinking

2026.04custom

코딩 78.57 · Agentic 58.33. 현재 코딩 리더.

§ KOREAN한국 sovereign한국어 우선 · 데이터 주권8 models

NAVERLIVE

HyperCLOVA X · THINK

2025proprietary

한국어 6,500× 학습 데이터. 정밀 추론 옵션. 프런티어급 sovereign.

NAVERLIVE

HyperCLOVA X · DASH

2025proprietary

경량 · 고속 응답. 실시간 라인.

NAVERLIVE

HyperCLOVA X SEED 32B Think

2025.12.26open-source

32B · vision-language reasoning · AAII 44. EXAONE 4.0 32B 능가.

NAVERLIVE

HyperCLOVA X SEED 8B Omni

2025.12.26open-source

8B 통합 멀티모달 (텍스트·이미지·음성 in/out). 경량 배포.

UPSTAGELIVE

Solar Pro 2

2026proprietary

한국 sovereign LLM. 정부 240억원 사업 선정.

SKTLIVE

SKT A.X 3.1 Lite

202532K ctxopen-source

7B · KMMLU2 96% · HuggingFace 공개.

LGLIVE

EXAONE 4

2026custom

대기업 sovereign · 정부 5대 컨소시엄 선정.

KAKAOLIVE

Kanana

2025custom

카카오 sovereign 라인.

⚠ NOT LISTED제외된 deprecated 모델: gpt-4o · gpt-4.1 · o4-mini (2026.02.13 retired) · gpt-5.1 · gpt-5.2 (2026.03.11 retired) · gemini-2.x (2026.06.17 deprecation) · claude-3.x series (legacy). 마이그레이션 완료.

§ PROVIDER PATTERN큐레아 엔진은 단일 ABC 인터페이스 위에서 어떤 모델이든 교체 가능. 모델은 고정 자산이 아니라 교체 가능한 실행 슬롯입니다. ★ CUREA 배지는 현재 운영 라인에서 활성 사용 중.

★ REAL CODE · QGEN-AI

추상적 약속이 아닌 실제 패턴.

CUREA · CODE · QGEN-AI§ REAL PATTERNS · NOT MARKETING

app/infrastructure/ai/providers/openai_llm_provider.pypython

from functools import lru_cache
from langchain_openai import ChatOpenAI
from loguru import logger
from app.infrastructure.ai.base_llm_provider import BaseLLMProvider


class OpenAILLMProvider(BaseLLMProvider):
    """OpenAI GPT-5.5 provider for question generation."""

    async def invoke(
        self,
        prompt: str,
        *,
        temperature: float = 0.7,
        max_tokens: int = 2048,
    ) -> str:
        logger.debug("openai.invoke.start", chars=len(prompt))
        llm = ChatOpenAI(model="gpt-5.5", temperature=temperature)
        response = await llm.ainvoke(prompt)
        return response.content


@lru_cache(maxsize=1)
def get_openai_provider() -> OpenAILLMProvider:
    return OpenAILLMProvider()

LangChain + ABC + @lru_cache 싱글톤. 어떤 벤더든 같은 인터페이스로.

02 · CONTENT

Content Grid

콘텐츠 저장소

단일 출처. 모든 제품이 같은 그리드에서 읽습니다.

Curea의 모든 콘텐츠는 하나의 그리드에 산다. 풀림이 읽고, 라스쿨이 읽고, 새빛인강이 읽는다. 중복 저장소 금지. 1.2M validated items, 4,800 taxonomy nodes, 한 PostgreSQL 축에 모입니다.

Items

1.2M

versioned · COW

Taxonomy

4,800

3-Depth · LTREE

Block types

12+

enum-extensible

Licensing

Per-item

per-surface allowed

CUREA · DIAGRAM§ HUB · ONE GRID · MANY SURFACES

§ ONE HONEST GRID모든 제품이 같은 그리드에서 읽고 같은 그리드에 씁니다. 중복 저장소 금지. Per-item · per-surface 라이선싱은 자동.

§ Plain · 쉬운 버전

For teachers, parents, students, journalists

§ THINK OF IT LIKE

레고 블록 한 통.

한 덩어리의 콘텐츠가 아니라, 지문 블록 · 선지 블록 · 해설 블록 · 이미지 블록 · 오디오 블록으로 쪼개진 부품. 각각이 독립적이고 교체·재조립이 가능합니다.

§ AT CUREA

한 그리드, 모든 제품이 같이 읽는다.

그래서 새로운 과목(예: 국어 → 물리)을 추가할 때 시스템을 다시 짓지 않습니다. 블록 한 종류를 더 쓰면 됩니다.

같은 이유로, 문제 한 개에서 시작된 구조가 문제집 · 개념서 · 강의 슬라이드 · 학습 미디어까지 같은 블록 문법으로 확장됩니다.

§ Technical · 기술 버전

For engineers, investors, technical reviewers

COMPONENTBLOCK

블록 추상화

모든 콘텐츠 타입이 블록 조합으로 표현됩니다. 단일 enum + 개별 블록 타입 스키마. 신규 블록 타입 추가 = enum 확장 + 렌더러 1개. DB 마이그레이션 불필요. 업계 유사 패턴: Notion · Gutenberg · Confluence.

SUBJECT-AGNOSTIC

과목 중립

과목은 블록 조합의 프로필일 뿐입니다. 국어 · 수학 · 영어 · 과학 · 사회 · 한국사 모두 동일 스키마 위에서 표현됩니다.

PLATFORM REUSE

플랫폼화

같은 블록이 question · workbook · concept book · slide · shorts 어디서든 ID 참조로 재사용. 풀림 스튜디오(studio 서비스)가 이 조합을 편집하는 레이어.

03 · TRUST

Validation Layer

검증층

세 도장. 그렇지 않으면 학습 콘텐츠가 아닙니다.

AI 1차 · AI 2차 (cross-vendor) · verified teacher. 하나라도 빠지면 학생에게 가지 않습니다. soft warning 이 아니라 아키텍처 레벨의 hard gate.

Stages

AI · AI · Expert

Accuracy

94.2%

rolling 30-day

Reviewers

240

verified teachers

Difficulty ±1

86.8%

1,218-item GT

CUREA · DIAGRAM§ SWIMLANE · 세 주체, 다른 속도

§ 01

AI 1차 검증

AI · TIER-1 VALIDATOR

automated · seconds

§ 02

AI 2차 (교차 벤더)

AI · CROSS-VENDOR JUDGE

cross-model · seconds

§ 03

검증 교사

VERIFIED TEACHER

human · deliberate · minutes

§ RHYTHM · 리듬AI ≈ SECONDS · HUMAN ≈ MINUTES — 그래서 느리다.

§ Plain · 쉬운 버전

For teachers, parents, students, journalists

Curea는 하나의 문제에 세 번의 도장을 찍습니다. 하나라도 빠지면 학생에게 가지 않습니다.

STAMP 1 · AI

1차 AI 도장

빠르고 값싼 모델이 먼저 봅니다. 형식이 맞는지, 명백히 틀린 곳은 없는지, 선지와 지문이 서로 어긋나지 않았는지. 여기서 걸러지면 뒤 단계로 올라가지 못합니다.

STAMP 2 · CROSS-VENDOR

2차 AI 도장 · 교차 검증

1차와 다른 회사 · 다른 성격의 모델이 들어와 의심하며 다시 봅니다. 오답지의 품질, 난이도, 전체가 교육적으로 말이 되는지. 1차에서 놓친 미묘한 결함을 여기서 잡습니다.

STAMP 3 · TEACHER

3차 교사 도장

두 AI를 모두 통과한 문제는 교사의 책상 위에 올라갑니다. 교사가 “이건 학생에게 줘도 되겠다”고 승인해야 비로소 학생에게 갑니다.

§ Technical · 기술 버전

For engineers, investors, technical reviewers

§ 01STAMP 11차 검증 모델

형식 준수, 지문-선지 정합성, 명백한 논리/사실 결함. Stamp 1은 통과·탈락과 무관하게 모든 문항에 적용되는 레이어. 저지연 · 저비용 · 구조화 출력에 강한 모델군이 1차 필터를 맡습니다.

§ 02STAMP 2교차 벤더 Judge

오답지 품질, 난이도 측정, 최종 일관성 · 교육적 적절성. Cross-Vendor 원칙 + 작업 적합성(critique · 비교 · 난이도 판단) + Failure-mode 상보성(생성 라인의 구조화 강점 + 검증 라인의 정성 판단 강점)이 세 가지 이유.

§ 03STAMP 3교사 승인 + 재생성 루프

두 AI 도장을 통과한 문제만 교사에게 도달. 교사의 선택은 승인 또는 재생성. 거절 → 새 파이프라인 실행으로 재주입되어 원본은 기록된 채 새 버전이 다시 세 도장을 거칩니다. 교사의 교육적 판단 권한을 아키텍처 레벨에서 보장합니다.

§ 04HARD GATE · QC DOMAIN하드 게이트 · qc 도메인

세 도장 중 하나라도 받지 못한 문제는 다음 단계로 넘어가지 못합니다. soft warning이 아니라 hard gate. domain/qc가 BusinessException + ErrorCode 패턴 (QC_EVALUATION_NOT_FOUND 등) 으로 실패를 명시적으로 분류해 다음 라인으로 흐르지 않게 막습니다.

§ 05RLHF · MODEL EVALRLHF · 모델 평가

교사의 도장과 재생성 판단은 domain/model_eval로 흘러 신규 모델 자동 적합성 평가 + 인간 피드백의 입력이 됩니다. AI · HUMAN · RLHF × 5차원 매트릭스로 모델 교체 시점을 결정합니다. (Wave 1 · model-eval workstream)

★ LIFECYCLE · ONE QUESTION

문항 한 개의 라이프사이클을 따라가보면.

§ NDA · PARTNER ACCESS모델명 · 정확 지연 측정값

개별 호출의 정확한 모델명 · 토큰 · 지연 측정값은 일반화되어 있습니다 (frontier · fast 카테고리). 운영 SLA · 벤더 책임 영역은 NDA 후 공개.

NDA 요청 →

CUREA · LIFECYCLE · ONE QUESTION§ FROM POST → INVENTORY · 12 EVENTS

트레이스 IDSESS_a1f4·trace

총 소요2시간 42분

LLM 호출2회 · cross-vendor

세 도장PASS · PASS · PASS

09:00:00.012API
api/v1POST /v1/generate
GenerateQuestionRequest 검증 통과
09:00:00.018APP
applicationgenerate_question_usecase
DB 세션 + provider 주입
09:00:00.024DOMAIN
domain/generationprompt build
단원 메타 + Bloom + 예제 주입
09:00:00.027INFRA
infra/aifrontier invokefrontier · 벤더 A< 1s
프런티어 모델 단발 호출
09:00:00.850DOMAIN
domain/qcstamp_one.start
형식 + 지문-선지 정합성
09:00:00.892INFRA
infra/aicross-vendor judgefrontier · 벤더 B< 1s
독립 벤더 Judge 호출
09:00:01.512DOMAIN
domain/qcstamp_two.pass
difficulty ±1 OK · 적절성 OK
09:00:01.520INFRA
infra/persistenceflywheel_events.insert
{ event_type: 'stamp_pass', stage: 2 }
09:00:01.523DOMAIN
domain/qcqueued for stamp_three
교사 검수 큐로 (async)
11:42:18.000API
api/v1teacher approve
POST /v1/qc/approve
11:42:18.045INFRA
infra/persistencecontent_grid.persist
검증 콘텐츠 그리드 진입
11:42:18.050INFRA
infra/persistenceflywheel_events.insert
{ event_type: 'stamp_three_approved' }

§ TRACEABLE모든 이벤트가 동일 session_id 로 PostgreSQL 한 축에 기록됨. SQL 한 줄로 어떤 문항이든 라이프사이클 재구성 가능. 외부 SaaS 의존 0.

04 · TAXONOMY

Learning Taxonomy

학습 분류 체계

블룸 × 어휘 × 문법. 정량으로 잰 난이도.

"쉬움 / 보통 / 어려움"은 교육학이 아닙니다. Curea 는 블룸 6단계 — 기억 · 이해 · 적용 · 분석 · 평가 · 창조 — 를 직접 매핑하고, 문장 안의 문법 복잡도와 어휘 복잡도를 함께 측정합니다.

Bloom levels

fully mapped

Taxonomy nodes

4,800

3-Depth

Ground truth

1,218

41 유형, 2022 개정

±1 match rate

86.8%

rolling

CUREA · DIAGRAM§ TAXONOMY · 3-DEPTH × 4,800 NODES

§ ROOT

한국 교육과정

3-Depth · sovereign · curated

§ 01

국어

720 nodes

§ 02

영어

940 nodes

§ 03

수학

1,280 nodes

§ 04

과학

860 nodes

§ 05

사회

480 nodes

§ 06

한국사

320 nodes

§ 07

자격증

200 nodes

§ BLOOM × 6단계 — orthogonal axis

REMEMBER기억

UNDERSTAND이해

APPLY적용

ANALYZE분석

EVALUATE평가

CREATE창조

§ Plain · 쉬운 버전

For teachers, parents, students, journalists

“쉬움 / 보통 / 어려움”은 교육학이 아닙니다.

학생이 “단순 암기”에 머물고 있는지, “평가 · 창조” 단계까지 올라왔는지를 시스템이 구분합니다. 그리고 같은 “응용” 단계 안에서도 중학교 2학년용과 고등학교 3학년용을 따로 식별합니다.

2022 개정 교육과정 41 유형 · 1,218 문항 Ground Truth 기준 ±1 등급 일치율 86.8%. 난이도 판정이 “교육학적 감”에 의존하지 않고 정량적으로 교정되어 있습니다.

§ Technical · 기술 버전

For engineers, investors, technical reviewers

BLOOM TAGGING

블룸 6단계 태깅

기억 · 이해 · 적용 · 분석 · 평가 · 창조 — 모든 문제 메타데이터에 포함. 학습 분석 · 개인화 추천의 교육학적 근거.

LEXICAL × SYNTACTIC

어휘 × 문법 복잡도

LC × SC

qc_preprocessing_service.py — 관계절 · 명사절 · 수동태 · 간접화법 분포를 regex로 탐지. OOS 리스트로 목표 학년을 벗어난 어휘 감지.

TAXONOMY GRAPH · 9 TABLES

분류 그래프 · 9 테이블

4,800

한국 교육과정 그래프를 PostgreSQL의 LTREE로 계층 관리. qgen-ai 마이크로서비스의 Alembic이 관리하는 9개 Taxonomy 테이블로 구현 — Sovereign · 자체 구축 · 수작업 큐레이션.

±1 GRADE MATCH

난이도 판정 일치율

86.8%

다변수 난이도 = 블룸 × 텍스트 복잡도 × 목표 학년 편차. QC Tier 2에서 DIFFICULTY_MISMATCH 판정이 나오면 Retry 큐로 순환합니다.

05 · CORPUS

Sovereign Corpus

독자 코퍼스

한국 교육과정 · 자체 구축. 빌려온 것이 아닙니다.

Curea 가 Inventory-First 전략으로 만들어 둔 1.2M 검증 콘텐츠 + 4,800 분류 노드 + 41 유형 1,218 문항 GT. 사용자가 늘어나도 응답 속도와 품질을 안정적으로 유지하는 구조의 원천.

Validated items

1.2M

three-stamped

Weekly growth

~22K

sustained 12 mo

Batch mode

Yes

pre-generated

Inventory reuse

Scale

request-time load down

CUREA · DIAGRAM§ STACK · INVENTORY-FIRST PRODUCTION LOOP

§ INPUT

수요 예측 + 키워드 사용 로그가 다음에 만들 유형을 결정합니다.
단순히 많이가 아니라, 다음에 필요할 가능성이 높은 것을 먼저.

§ 01키워드 셀렉터KEYWORD SELECTOR수요 예측

§ 02배치 빌더BATCH BUILDERJSONL 큐

§ 03다중 벤더 BatchMULTI-VENDOR BATCH50% 할인

§ 04폴러BATCH POLLEREventBridge · 5min

§ 05StagingSTAGING TABLE원시 출력

§ 06QC 1차 + 2차QC TIER 1 + 2cross-vendor

§ 07메인 재고MAIN INVENTORY검증 완료

§ 08교사 도장TEACHER STAMPStamp 3 → 학생

§ OUTPUT

학생 입장에서는 “빠르게 꺼내진 문제”.
한계비용이 사용자 수에 역비례.

§ ASYMPTOTIC COSTOn-Demand 100% 모델 대비 단위경제가 사용자 규모에 역비례 개선됩니다.

§ Plain · 쉬운 버전

For teachers, parents, students, journalists

§ THINK OF IT LIKE

창고에서 꺼내는 문제.

학생이 “문제 주세요” 눌렀을 때 그 순간부터 만들기 시작하면 — 느리고, 비싸고, 품질 편차가 큽니다.

Curea는 대신 미리 만들어 놓은 문제 창고를 둡니다. 수요가 예측되는 유형은 한 번에 수천·수만 건씩 배치 모드로 제작해 창고에 쌓습니다.

§ AT CUREA

빠르게 꺼내진 문제.

창고에 들어가기 전 AI 두 도장은 이미 찍혀 있습니다. 교사가 꺼낼 때 세 번째 도장이 찍히면 그대로 학생에게 갑니다. 학생 입장에서는 “느리게 만들어진 문제”가 아니라 “빠르게 꺼내진 문제”를 받습니다.

속도가 빠른 이유 하나 더 — 반복 수요가 예상되는 유형을 배치로 먼저 만들고 검증합니다. 사용자가 많아져도 학생 요청 시점의 실시간 생성 부담이 커지지 않습니다.

§ Technical · 기술 버전

For engineers, investors, technical reviewers

§ 01PRE-GENERATION배치 사전 생성

On-Demand 생성이 아닌 배치 사전 생성이 기본. 사용자 요청마다 새로 만드는 구조와 달리, 한번 검증한 재고를 반복 활용하도록 설계되어 운영 부하가 예측 가능합니다.

§ 02MULTI-PROVIDER BATCH다중 벤더 Batch 계층

동일한 Batch Provider 인터페이스로 여러 벤더의 배치 채널을 하나의 추상화로 묶어, 처리량과 안정성이 더 좋은 채널이 등장하면 호출 라우팅을 이동시킵니다.

§ 03PRODUCTION LOOP · FLYWHEEL EVENTS대량 생성 + 플라이휠 표준

Keyword Selector → Batch Builder → Batch Poller → QC Pipeline → Main Inventory. Retry Queue가 실패 문항을 실패 사유와 함께 다시 생산 라인으로 돌리고, 모든 생성·검증·교사 도장 이벤트는flywheel_events 테이블에 표준 스키마로 적재되어 데이터 플라이휠 (data-flywheel workstream · shipped)의 입력이 됩니다.

§ 04FALLBACK실시간 경로 전환

재고 miss 시 실시간 경로로 투명 전환. 교사 입장에서는 두 경로의 차이를 체감할 수 없고, 세 도장 기준은 같습니다.

06 · OBSERVABILITY

Evaluation Harness

평가 · 관측층

모든 문항이 재생됩니다. 모든 호출이 감사 가능합니다.

Curea 는 "왜 이 문제가 이렇게 만들어졌는지"를 나중에도 되짚을 수 있게 만들어 둡니다. 어느 모델이, 어떤 프롬프트로, 어떤 지연 시간 안에, 무엇을 만들었는지가 전부 기록에 남습니다.

Trace coverage

100%

every LLM call

Replay support

Yes

any step, any run

External proxies

data sovereignty

Per-call fields

prompt · cost · latency · …

CUREA · DIAGRAM§ MATRIX · COVERAGE = 100%

§ DIMENSION

INPUT프롬프트

OUTPUT응답

COST비용

LATENCY지연

STATUS상태

LAYER 1 · ORCHESTRATION파이프라인 동선

LAYER 2 · LLM CALL모델 호출 속살

§ JOINED ON SESSION_ID두 레이어가 동일 ID 로 조인되므로 단건 문제의 전체 생애를 SQL 한 번으로 재구성. 외부 SaaS 의존 0.

§ Plain · 쉬운 버전

For teachers, parents, students, journalists

실패가 재현 가능하면, 재현 가능한 것만 진짜로 고칠 수 있습니다. 관측은 두 층으로 나뉘며, 한 DB 안에서 서로 연결됩니다.

LAYER 1 · BATCH ORCHESTRATION

파이프라인 동선

domain/batch 상태 머신이 문제 한 건의 생성·검증· 재시도·아카이브 동선을 기록. 각 단계의 input · output · 상태 전이가 그대로 남습니다.

LAYER 2 · MODEL CALL

모델 호출의 속살

domain/generation · domain/qc 가 LangChain으로 호출한 모든 LLM 요청을 per-call로 기록 — 프롬프트 · 응답 · 토큰(input · output · cache) · latency.

JOIN · POSTGRESQL

두 층의 결합

동일한 session_id로 조인하면 “왜?”라는 질문 하나로 끝까지 따라갈 수 있습니다. PostgreSQL (Supabase · transaction mode port 6543) 한 축에서 SQL 한 줄로 재구성 가능. 외부 SaaS 의존 0.

§ Technical · 기술 버전

For engineers, investors, technical reviewers

TRACE COVERAGE

전수 추적

100%

Step Functions 실행 이력 = auditable event log. 각 Sub Session · Main Session 의 스텝별 input · output · duration · retry · 상태 전이가 보존.

STEP-LEVEL REPLAY

스텝 단위 재실행

Replay

실패한 실행을 특정 스텝부터 리플레이 · 재실행 가능합니다. 실패가 재현 가능해야 진짜 고칠 수 있습니다.

EXTERNAL PROXIES

외부 프록시 0개

자체 REST API 래퍼를 경유하는 이벤트 드리븐 아키텍처. Helicone · Langfuse 같은 외부 프록시를 두지 않습니다. 관측 데이터 자체가 학습 플라이휠의 입력.

PER-CALL FIELDS

호출 단위 7 필드

API 단위로 프롬프트 · 응답 · 토큰(input · output · cache hit) · 토큰 · latency · 호출자가 DB에 per-call 기록. P0 로드맵: 골든셋 기반 회귀 감지 확장.

07 · API

QGen API

엔진 API

엔진을 라이선스하세요. 자체 브랜드로 운영하세요.

QGen API 는 KB 라스쿨 AI · 새빛인강이 운영 중인 그 엔진 그대로. 다중 벤더 라우팅 계층 위에서 동일한 세 도장 (AI 1차 · AI 2차 · 검증 교사) 을 적용합니다. 파트너 라이선스 기반으로 제공합니다.

Status

Partner access

license required

Operating proof

Live

KB · 수원시 운영

Model swap

< 24h

no breaking change

Trace header

X-Curea-Trace

per-call

CUREA · DIAGRAM§ API BRIDGE · WHITE-LABEL HANDSHAKE

§ PARTNER BRAND

자체 학습 브랜드

학생 화면 · UX

교육과정 그래프

Stamp 3 (강사 승인)

관측 데이터 · SQL export

§ CUREA SUBSTRATE

엔진 라이선스

QGen API + Provider 라우팅

Stamp 1 + Stamp 2 (cross-vendor)

Inventory · 다중 벤더 Batch

Layer 1 + Layer 2 관측

§ WHITE-LABEL학생 화면에는 Curea 가 보이지 않습니다. 호출은 양방향으로 흐르고, 세 도장의 기준은 동일합니다.

§ Plain · 쉬운 버전

For teachers, parents, students, journalists

§ THE PROBLEM

자체 브랜드, 검증된 콘텐츠.

파트너 기관이 자체 브랜드로 운영하려 할 때, 콘텐츠 검증과 운영 안정성이 가장 큰 부담입니다. 외부 AI에만 의존하면 출제 품질을 통제하기 어렵고, 자체 시스템을 짓기에는 시간이 부족합니다.

§ AT CUREA

그 사이에 들어가는 API.

파트너는 Curea의 검증 파이프라인 전체를 호출 가능한 형태로 쓰면서, 학생 화면은 자체 브랜드로 노출합니다. KB 라스쿨 AI · 새빛인강이 이미 같은 구조 위에서 운영 중입니다.

§ Technical · 기술 버전

For engineers, investors, technical reviewers

AUTH

인증

Provider Pattern 기반 multi-tenant 키. 호출 한도와 라우팅 우선순위는 파트너별로 분리.

OBSERVABILITY

관측

파트너 호출은 X-Curea-Trace 헤더로 어느 모델이 어느 단계에 들어갔는지 per-call 추적. 동일 데이터가 파트너 자체 분석 도구로도 export 가능합니다.

INVENTORY ROUTING

재고 우선 경로

파트너가 사전 협의한 유형은 Inventory-First 경로로 응답. 미리 검증된 재고에서 즉시 꺼내 파트너의 Stamp 3에 전달합니다.

SLA

운영 보장

KB 라스쿨 AI와 새빛인강 운영에서 검증한 트래픽 안정성. 모델 swap 24시간 내, 벤더 장애 자동 fallback.

§ Stack overview

엔진은 라이선스로, 브랜드는 직접 운영하세요.

QGen API · Custom Build · Partner Program. KB 라스쿨 AI · 새빛인강이 이미 같은 구조 위에서 자체 브랜드로 운영 중입니다.

도입 검토 받기 · 영업일 1~2일 회신→고객 사례 보기

여덟 레이어, 하나의 코어.

qgen-ai에서 지금 무엇이 굴러가는지.

QGen Engine

7개 도메인이 어떻게 연결되는가.

지금 어떤 모델이, 어디서, 어떻게 돌고 있는가.

GPT-5.5

GPT-5.4 Pro

Claude Opus 4.7

Gemini 3 Pro

Claude Sonnet 4.6

Claude Haiku 4.5

Gemini 3 Flash

Gemini 3.5 Flash

Gemini 3.1 Flash Lite

GPT-5.3 Instant

DeepSeek V3.2

DeepSeek V4 (Preview)

Llama 4 Scout

Llama 4 Maverick

Qwen 3.5

Mistral Medium 3.5

Gemma 4

Kimi K2.6 Thinking

HyperCLOVA X · THINK

HyperCLOVA X · DASH

HyperCLOVA X SEED 32B Think

HyperCLOVA X SEED 8B Omni

Solar Pro 2

SKT A.X 3.1 Lite

EXAONE 4

Kanana

추상적 약속이 아닌 실제 패턴.

Content Grid

레고 블록 한 통.

한 그리드, 모든 제품이 같이 읽는다.

블록 추상화

과목 중립

플랫폼화

Validation Layer

1차 AI 도장

2차 AI 도장 · 교차 검증

3차 교사 도장

문항 한 개의 라이프사이클을 따라가보면.

Learning Taxonomy

Sovereign Corpus

창고에서 꺼내는 문제.

빠르게 꺼내진 문제.

Evaluation Harness

파이프라인 동선

모델 호출의 속살

두 층의 결합

QGen API

자체 브랜드, 검증된 콘텐츠.

그 사이에 들어가는 API.

인증

관측

재고 우선 경로

운영 보장

엔진은 라이선스로, 브랜드는 직접 운영하세요.