VA KRAFTON Agent Case

01 / Executive answer

현장 AI를 운영해본 사람이 Agent Harness 연구를 더 빠르게 실험·검증할 수 있습니다.

박진배는 모델 호출자가 아니라, 관찰·도구사용·기억·검증·개선 루프를 실제 제약 안에서 설계하고 끝까지 운영해본 후보입니다.

What200+의료기관 사용 AI를 모델 개발부터 설치·검증까지 운영
How15m20개 영상 final set을 제한시간 안에 자동 풀이
Changed4,344Hermes Agent가 수집 batch를 검증·보고한 운영 로그
Evidence-grounded AI agent harness from video frames to verifier loop
v4 target operating model: video evidence, tool routing, memory, verifier loop

첫 문장은 “저는 현장 AI를 운영해본 경험을 Agent Harness 연구로 가져갈 수 있습니다”로 시작하면 됩니다.

02 / Evaluator answer map

평가자가 물을 질문은 8개이고, 모두 하나의 논리로 답할 수 있습니다.

One-line answer 박진배는 문제를 끝까지 제품·운영 상태로 보내는 AI 시스템 오너입니다.
커뮤니케이션
의료진, 규제, 설치, 모델, SW 패키징 사이를 연결
문제해결
시간·하드웨어·영상 품질·임상 검증 제약을 설계로 해결
가치창출
200+ 의료기관 사용, 논문 8편, 특허 7+3건, 해커톤 성과
매년 업데이트
방산 전자 → 실시간 영상 AI → 의료 AI 제품 → Agent 연구로 전환
에이전트
VideoAgent는 harness 연구, jiwonhae는 운영형 agent 자동화
우대사항
Harness, multi-agent, benchmark, production AI, special domain에 대응
오너십
모델 개발에서 배포, 검증, 피드백까지 끝을 보는 방식
협업
trace와 evidence를 남겨 함께 문제를 보게 만드는 스타일

질문을 받으면 이 8문장으로 곧장 답하고, 뒤 장표에서 각각의 증거를 보여주면 됩니다.

03 / KRAFTON role and culture fit

KRAFTON이 요구한 역량은 “agent를 연구 가능한 시스템으로 만드는 능력”으로 모입니다.

AI Agent Research Mission

  • Harness: Planning, Memory, Tool Use, Loop, Evaluation
  • Multi-agent orchestration / agentic workflow
  • Agent benchmark construction
  • Production AI / special-domain AI research

Public AI Direction

  • 한화에어로스페이스-KRAFTON Physical AI MOU는 현실 환경 AI 확장 신호
  • 방산 전자, 실시간 6ch 영상 AI, edge inference 경험이 이 맥락과 연결
  • 단, 이 자료는 공개 기사 맥락으로만 사용하고 참여 사실로 말하지 않음

Talent Fit

  • 넓게 보는 전문가: 의료·방산·영상·Agent 연결
  • 유저 관점: 병원 사용과 현장 피드백 경험
  • 변화 적응: 제품 AI에서 agent research로 빠르게 재구성
  • 생산적 커뮤니케이션: 실패 로그와 evidence trace 공유
  • 책임과 신뢰: 규제 제출, 설치, 검증, MIL-STD 경험

“KRAFTON 인재상에 들어가나?”라는 질문은 성격이 아니라 작동 방식의 증거로 답합니다.

04 / Operational agent proof

jiwonhae.com은 웹사이트가 아니라, 매일 바뀌는 정보를 수집·검증·보고하게 만든 운영형 Agent 사례입니다.

  1. Sense10+ 공공 포털 수집
  2. Normalize단일 DB 스키마 정리
  3. RunVercel Cron 자동 실행
  4. VerifyHermes Agent가 DB/API 검증 후 Discord 보고
2,900public API total 7,463procurement total 4,344fetched / upserted 28sources checked

VideoAgent가 연구형 agent라면, jiwonhae는 실제 서비스 운영에서 agentic loop를 만든 증거입니다.

05 / Mini benchmark

VideoAgent 문제는 final set 공개 후 15분 안에 관찰·도구선택·판단·제출을 끝내야 하는 mini agent benchmark입니다.

20 final test videos shown as a contact sheet
실제 final test 20개 영상의 첫 프레임 contact sheet
20video-prompt pairs 15mreleased before deadline 1200smax video length 1.0perfect hidden score

전체 영상을 그냥 보는 문제가 아니라, 어떤 도구로 어느 구간의 증거를 찾을지 결정하는 문제입니다.

06 / What was built

v3는 제한시간을 만족한 working system으로, 질문 분류부터 제출까지 자동화했습니다.

Classify9 question types
SampleOpenCV dual frame sets
AskGPT + Gemini + Claude
Votemajority and consensus rules
Submit20-letter answer string
Finding 무엇을 했나: 자동 풀이. 어떻게 했나: classify-sample-ask-vote-submit. 무엇이 달라져야 하나: 실패 원인을 남기는 trace.

여기서 말할 것은 “모델을 많이 썼다”가 아니라, 15분 제한 안에서 작동하는 시스템을 설계했다는 점입니다.

07 / Improvement thesis

v4의 핵심 전환은 “답을 고르는 voting”에서 “근거를 남기는 evidence contract”로 가는 것입니다.

v3 Answer selection 여러 모델이 답을 내고 voting으로 선택. 빠르지만 왜 틀렸는지 남기기 어렵다.
v4 Evidence-grounded harness 질문 routing, 도구 출력, timestamp evidence, memory, verifier 판정을 함께 저장한다.

“더 센 모델”보다 중요한 개선은 실패를 설명하고 재현 가능하게 만드는 구조입니다.

08 / Recursive improvement loop

재귀 개선은 많이 돌리는 것이 아니라, 실패 로그가 다음 수정 대상을 강제로 남기는 구조입니다.

Traceanswer + evidence + verifier reason
Diagnosemissing evidence / wrong tool / weak solver
Patchrouter, tool order, prompt, solver, budget 중 하나만 수정
Replay동일 regression set에서 비교
Promote좋아진 변경만 기본값으로 승격

정답이 없어도 “무엇을 고쳤고 왜 좋아졌는지”를 trace quality 기준으로 설명할 수 있습니다.

09 / Evaluation strategy

Hidden answer key가 없어도, 개선 주장은 proxy metric과 ablation으로 좁혀서 증명할 수 있습니다.

Known labelssample set과 문제 원문 예시로 sanity check
Evidence coverage답마다 timestamp evidence가 있는지 측정
Verifier support근거가 선택지를 지지하는지 판정
Replay stability동일 seed와 budget에서 답과 근거가 유지되는지 확인
Ablation deltaASR/OCR/scene/verifier 제거 시 변화 측정

100점을 주장하지 않고, 개선됐다는 말을 검증 가능한 하위 지표로 바꿉니다.

10 / Closing packet

작동한 솔버를 KRAFTON Agent Harness 연구 사례로 바꿔 설명할 수 있습니다.

검토자는 원문 문제, 기존 v3 리포트, v4 설계, 외부 맥락을 직접 열어볼 수 있습니다. 저는 이 자료를 기준으로 무엇을 했고, 어떻게 했고, 무엇을 개선할지 설명합니다.

마지막 메시지는 “수상했다”가 아니라 “작동한 시스템을 연구 가능한 harness로 재구성했다”입니다.