IL KRAFTON Agent Systems Portfolio

01 / PORTFOLIO THESIS

현장 AI를 검증 가능한 Agent 시스템으로 바꾸는 사람.

시뮬레이션으로 실패 조건을 찾고, 실제 운영 로그로 검증하고, 다음 실행이 더 좋아지는 Agent Harness 구조를 설계해왔습니다.

Case 01 Medical AI 자체 점수와 현장 사용성의 간극을 Field Benchmark로 전환.
Case 02 Edge Vision Jetson Xavier 6ch 영상 추론 병목을 처리 구조로 해결.
Case 03 Simulation RL 고정 규칙을 실패 재현과 정책 조정 문제로 전환.
Case 04 Ops Agent jiwonhae 수집기를 Hermes 검증·보고 루프로 확장.
Case 05 VideoAgent v3 해커톤 풀이를 v4 Tool Use·Memory·Verifier Harness로 재정의.

02 / CASE 01A - MEDICAL AI PRODUCTION / ENAD BENCHMARK GAP

자체 테스트셋 점수는 높았지만, 현장 의사는 “못 쓰겠다”고 말했습니다.

ENAD는 내시경 검사 중 의사의 병변 탐지와 진단을 보조하는 실시간 AI입니다. 내부 데이터와 보안을 넘어, 가장 큰 문제는 내부 점수가 실제 내시경실의 신뢰로 바로 이어지지 않는다는 점이었습니다.

문제통제된 자체 데이터셋에서는 좋아 보여도 병원마다 영상 화질, 노이즈, 장비, 검사 흐름이 달랐습니다.
조치“못 쓰겠다”는 피드백을 화질, 밝기, 장비 차이, 사용 흐름 같은 현장 변수로 분해했습니다.
효과문제를 모델 정확도가 아니라 내부 점수와 현장 신뢰 사이의 Benchmark Gap으로 재정의했습니다.
Generated contrast diagram showing ENAD internal score versus hospital reality and physician not usable feedback
Internal benchmark scores did not guarantee trust in real endoscopy rooms.

03 / CASE 01B - FIELD BENCHMARK LOOP

의사 피드백을 Field Benchmark로 바꿔 제품 개선 루프를 만들었습니다.

많은 병원을 다니며 피드백을 구체화하고, 병원별 영상 품질과 기기 환경을 반영한 테스트셋과 벤치마크 점수를 다시 세웠습니다.

문제“못 쓰겠다”는 말은 그대로는 개발 요구사항이 아니어서, 제품 개선 기준으로 바꾸는 과정이 필요했습니다.
조치의사 피드백을 Field Variables로 정리하고, 병원 환경을 반영한 Site Benchmark를 개선 루프에 넣었습니다.
효과현장 피드백과 벤치마크 점수를 제품 개선 기준으로 연결해 ENAD 상용화와 200+ 의료기관 확장으로 이어졌습니다.
Generated loop diagram connecting physician feedback, field variables, site benchmark, product improvement and 200 plus adoption around ENAD
Field-aware evaluation loop: feedback becomes benchmark, benchmark drives product improvement.

04 / CASE 02 - REAL-TIME EDGE VISION

DeepStream으로 6채널 객체검출을 Jetson Xavier 엣지 런타임에 맞게 구성했습니다.

다중 영상처리 딥러닝 객체검출 기법을 비교하며, 서버급 자원 없이 6개 영상 입력을 엣지 장비 안에서 실시간으로 처리하는 파이프라인을 설계했습니다.

문제6개 스트림의 디코딩, 추론, 추적, 출력이 동시에 돌아가면 FPS, 지연시간, GPU, 전력 병목이 함께 발생합니다.
조치DeepStream의 decode, stream mux, inference, tracking, output 단계를 하나의 multi-stream pipeline으로 구성하고 성능을 비교했습니다.
효과Jetson Xavier에서 6채널 video processing and AI inference pipeline을 구현하며 runtime budget 감각을 확보했습니다.
Generated DeepStream pipeline diagram showing six video streams, Jetson Xavier, object detection, performance comparison and runtime budget
DeepStream-based multi-stream object detection under Jetson Xavier runtime constraints.

05 / CASE 03 - SIMULATION RL

규칙 기반 한계를 시뮬레이션 학습 루프로 개선했습니다.

조건문 형태의 제어가 대처하기 힘든 동적 시나리오를 학습 가능한 환경으로 옮기기 위해 강화학습 기반의 에이전트 정책과 가상 시뮬레이터를 다뤘습니다.

문제고정 규칙은 아군·적군·명령 조건이 바뀌는 시나리오에서 실패 조건을 일일이 커버하기 어렵습니다.
조치Unity 환경에서 아군, 적군, 명령 조건을 상태와 보상에 반영하고 실패 시나리오를 다시 돌릴 수 있게 했습니다.
효과규칙을 계속 추가하는 문제가 아니라, 실패를 재현하고 정책을 조정하는 학습 문제로 바꿨습니다.
Generated simulation environment with vessels, ally enemy agents and command-conditioned policy paths
Command-conditioned multi-agent reinforcement learning loop in Unity.

06 / CASE 04 - OPERATIONAL DATA OPS

단순 수집기를 데이터 통합 상태를 실시간 보고하는 에이전트로 개선했습니다.

jiwonhae의 공공 데이터 소스들을 수집, 정규화, 데이터베이스 적재한 후 Hermes 감시 루프로 정합성 이상을 보고하게 만들었습니다.

문제외부 소스 구조가 바뀌면 크롤러는 성공처럼 보여도 DB에는 깨진 데이터가 조용히 들어갈 수 있습니다.
조치수집-정규화-DB 적재 뒤에 Hermes 검증 리포트와 알림 루프를 붙여 이상 상태를 기록하게 했습니다.
효과28개 소스와 4,344건 로그를 기준으로 어떤 소스가 정상이고 어디가 깨졌는지 설명할 수 있게 됐습니다.
Generated operations pipeline with data sources, normalization, verifier bot and dashboard
Automated data verification and reporting loop ensuring quality control.

07 / CASE 05 - VIDEOAGENT BENCHMARK

1회성 답변 파이프라인을 스스로 디버깅하는 검증 루프로 개선합니다.

운영형 에이전트 경험 다음에, 해커톤 제한 시간 안에서 만든 v3의 한계를 분석하고 증거·도구·검증 로그가 남는 v4 구조로 재정의합니다.

문제v3는 15m 안에 답을 만들었지만, 왜 틀렸는지와 어느 timestamp를 근거로 봤는지가 남지 않았습니다.
조치Tool Use, Memory, Verifier를 결합해 질문 유형, 샘플 프레임, 모델 경로, evidence, budget을 저장하게 설계했습니다.
효과최종 정답 키가 없어도 evidence coverage, verifier support, replay stability로 개선 여부를 비교할 수 있습니다.
Generated VideoAgent solver diagram from video frames through routing and model voting
Evolution from static response pipelines to evidence-grounded agent harnesses.

08 / KRAFTON FIT

KRAFTON AI Agent Research에서 즉시 기여할 수 있는 세 가지 개선 루프입니다.

단순한 연구 결과 도출에 멈추지 않고, 시뮬레이션 환경, 임베디드 런타임, 제품화 배포, Self-improvement 가능한 Agent Harness를 연결합니다.

문제Agent 연구는 모델 호출만으로 끝나지 않고 시뮬레이션, 도구 사용, 기억, 평가, 운영 제약을 함께 다뤄야 합니다.
조치Production AI, Real-time Vision, Simulation RL, VideoAgent Harness 경험을 Agent 개선 루프로 연결합니다.
효과KRAFTON에서 Tool Use, Memory, Evaluation을 갖춘 Agent Harness 설계와 검증에 바로 기여할 수 있습니다.
Generated evidence-grounded agent harness with memory, tools, verifier and evaluation loop
Mapping past engineering evidence directly to KRAFTON AI agent research tracks.

09 / CLOSING THESIS

KRAFTON에서 모호한 AI 문제를 검증 가능한 Agent 시스템으로 바꾸겠습니다.

도메인은 달랐지만 방식은 같았습니다. 실패를 재현하고, 근거를 남기고, 다음 실행이 더 좋아지는 구조로 바꿨습니다.

문제재현되지 않는 실패는 개선되지 않습니다. Agent 연구도 실제 환경의 실패 조건을 먼저 잡아야 합니다.
조치시뮬레이션, 현장 피드백, 운영 로그, verifier를 연결해 판단 근거가 남는 루프를 만들었습니다.
효과Tool Use, Memory, Evaluation을 갖춘 Agent Harness를 더 빠르게 실험하고 검증할 수 있습니다.
Generated diagram connecting simulation, evidence, robotics, archives, iteration, and performance into one agent lab
Closing operating model: reproduce failures, verify evidence, and keep the system improving.