🤖 AI / LLMOps
AI 평가 루브릭 실전 설계
프로덕션 AI 기능을 위해 품질 기준, 실패 유형, 릴리스 게이트를 어떻게 정의할지 정리한 실전 가이드입니다.
AI DevOps Korea
aidevops.kr에서 LLMOps, RAG, AI Agent, 관측성, 평가, 비용-성능 최적화를 실전 운영 관점으로 정리합니다.
Tag Archive
이 태그는 현재 3개의 포스트와 연결되어 있습니다. 같은 문제를 다른 관점에서 다룬 글까지 함께 따라가면 주제 이해가 훨씬 빠르게 넓어집니다.
Expand The Topic
프로덕션 AI 기능을 위해 품질 기준, 실패 유형, 릴리스 게이트를 어떻게 정의할지 정리한 실전 가이드입니다.
프롬프트 계약, 구조화 출력, 버전 관리, 평가, 롤백, 팀 협업 흐름을 포함해 프롬프트 엔지니어링을 운영 관점으로 설명합니다.
문서 커버리지, 랭킹 품질, 답변 근거성, 실패 분석, 릴리즈 게이트를 포함한 RAG 평가 방법을 실무 기준으로 정리합니다.