company logo

[Deep Learning Div.] Deep Learning Engineer - ML Ops (Infra) (5년 이상)

KRAFTON.com

Office

Seoul

Full Time

크래프톤은 차별화된 크리에이티브를 가진 글로벌 제작 스튜디오들과 고유한 즐거움이 있는 게임을 발굴하여 전 세계에 퍼블리싱합니다. 우리는 지속적인 도전과 새로운 기술로 게임의 즐거움을 혁신하고, 더 많은 팬들에게 사랑받을 수 있도록 플랫폼과 서비스를 확장합니다. 우리는 열정과 의지를 지닌 동료들과 함께 성장하며, 글로벌 시장에서 인정받는 게임의 명가로 나아가고 있습니다.   KRAFTON is dedicated to identifying and publishing games worldwide that offer a uniquely enjoyable experience, crafted by our globally recognized production studios known for their distinctive creativity. We continuously push the boundaries of gaming enjoyment by embracing new challenges and technologies, expanding our platforms and services to captivate an even larger fan base. In collaboration with our passionate and driven team, we strive to establish ourselves as a renowned creator of masterpieces in the global gaming market.  

우리 팀(프로젝트)을 소개합니다.

[Deep Learning 본부 비전]

크래프톤 Deep Learning 본부는 사내외 여러 분야와 협업하여 다양한 문제에 대한 AI 솔루션을 제공하며, 자체 딥러닝 연구를 통해 우리만의 서비스를 개발합니다. 그 방향성은 크게 네 가지입니다.

  • Production Cost Down : 게임 제작에 수반되는 많은 공정들에 딥러닝 기술을 투입하여 제작 과정을 단축하고, 게임 제작자들의 업무 경험을 혁신합니다.
  • New Way to Create : 생성형 AI를 포함한 다양한 딥러닝 기술들로 게임 제작 전반에 걸쳐 창작자들의 크리에이티브를 확장합니다.
  • Virtual Friends : 딥러닝 기술 기반 Virtual Friend를 개발하고 이를 게임 내/외 다양한 어플리케이션으로 적용합니다.
  • Unique, Endless Gameplay : 딥러닝 기술을 통하여 유저들에게 매번 다른 경험을 선사하여 한계 없이 즐길 수 있는 게임 컨텐츠를 제공합니다.

[R&D]

  • Deep Learning 본부에서는 위 비전에 필요한Language Model, Voice Synthesis, Vision & Animation, Reinforcement Learning, Data-centric AI 등의 딥러닝 기술을 연구 개발 중입니다.
  • 또한, 이를 효과적으로 아우를 수 있는 초거대모델/경량화모델 연구 및 각각의 요소 기술들을 자유롭게 조합하는 Multimodal 모델 연구도 진행하고 있습니다. 이러한 기술들을 실제 게임 제작 환경에 통합하여, 게임 제작 업무 경험을 혁신하고 크리에이티브를 확장합니다.

[Culture Fit]

  • Deep Learning 본부 인원들은 다양한 프로젝트를 통하여 여러 분야의 팀원들과 교류하고 협업하며 다양한 문제에 창의적인 아이디어를 제시할 수 있습니다. 나이 및 직급에 관계없이 자유롭게 의견을 개진하는 분위기가 장려됩니다.
  • 다양한 문화적 배경을 가진 인원들이 모여 팀을 이루고 있으며 활발한 소통을 위해 통·번역 등 언어적 장벽을 해소할 수 있는 방법들을 적극 지원하고 있습니다.

[팀 소개]

  • KRAFTON MLSys & Ops 팀은 본부 내 모델 개발을 위한 GPU 인프라와 ML 플랫폼을 설계·구축·운영합니다.
  • 또한 게임 서비스에 투입되는 ML 모델의 서빙 및 모델 최적화와, 필요 시 온디바이스(엣지) 배포까지 지원합니다.

우리 팀과 함께할 미션을 소개합니다.

이번 채용 포지션은 인프라/플랫폼 운영과 고도화를 담당합니다. 

담당 업무 (Infra/Platform 중심)

  • Kubernetes 기반 ML/GPU 클러스터 설계·구축·운영
  • GPU 플랫폼 고도화
  • ML 플랫폼 구성요소 운영
  • 모델 서빙 인프라 운영
  • 데이터 경로·스토리지·네트워크 설계
  • 관측성·신뢰성·보안 체계
  • 표준화/자동화
  • 스케줄링/격리/보안, 업그레이드·증설, 멀티테넌시·리소스 효율화
  • 드라이버/런타임/디바이스플러그인, GPU Operator 운영, DCGM 기반 관측, MIG/MPS 활용, 용량·비용·성능 최적화
  • 실험/학습 워크스페이스, 잡/파이프라인 오케스트레이션(예: Argo Workflows 등), 아티팩트·레지스트리·스토리지
  • KServe/Triton/ONNX Runtime/Ray Serve 등 기반의 서빙 스택 운영, SLO(지연/처리량/가용성) 및 배포 자동화(Canary/Rollout)
  • 객체/블록/파일 스토리지(Ceph/MinIO 등), 고대역폭·저지연 전송 경로, (필요 시) IB/RoCE 등 학습 네트워킹 고려
  • 로그/메트릭/트레이싱(OTel), 경보·대시보드, 이미지 서명(cosign)·정책(OPA Gatekeeper/Kyverno)·런타임 보호
  • IaC/GitOps(Terraform/Argo CD 등) 기반의 재현 가능한 플랫폼 템플릿과 변경관리(롤백/감사) 운용

이런 경험을 가진 분과 함께 성장하고 싶습니다! (필수요건)

  • 프로덕션 Kubernetes 운영 경험
  • Linux 시스템/리소스 관리 심화 이해
  • GPU 워크로드 운영 경험
  • 관측성·운영 자동화
  • 문서화·협업 역량
  • 해외 출장에 결격사유가 없는 분
  • 장애 대응/업그레이드, 멀티 노드·멀티 클러스터 중 일부 실전 경험
  • cgroups/NUMA/IO/네트워킹, 컨테이너 런타임(containerd/CRI-O)
  • NVIDIA GPU Operator, k8s device plugin, DCGM, MIG/MPS 등 중 일부 실무 경험
  • Prometheus/Grafana/ELK·Loki/OpenTelemetry 중 일부, IaC/GitOps(Terraform/Argo CD 등) 경험
  • 운영 표준·SLO 정의, 변경관리·릴리스 노트 등 기술 커뮤니케이션

이런 경험들이 있다면 저희가 찾는 그 분입니다! (우대요건)

  • 클러스터/플랫폼 아키텍처 주도 경험
  • 서빙/플랫폼 운영 경험
  • SLO/비용/용량계획 거버넌스
  • 온프레미스 GPU 클러스터 신규 구축, CNI(Cilium/Calico)·서비스 메쉬(Istio/Envoy) 심화 운영
  • 분산 학습 인프라 경험
  • 스토리지/데이터 경로 최적화
  • 파이프라인/플랫폼 엔지니어링
  • 대규모 확장·마이그레이션·리플랫폼 또는 멀티테넌시 격리/비용·성능 최적화의 주도 사례
  • KServe + (Triton/ONNX Runtime) 또는 Ray Serve 등 모델 서빙 인프라 중 1개 이상 실운영
  • GPU 효율/지연/처리량 등 핵심 지표로 목표 수립·운영, 온콜·장애 사후분석 주도
  • NCCL/GPUDirect, IB/RoCE 네트워크, (Ray/Horovod/DeepSpeed 등) 학습 잡 오케스트레이션
  • Ceph/Rook, MinIO, 병렬/분산 파일시스템 설계·운영 및 성능 튜닝
  • Argo Workflows·Kubeflow·Airflow 등 잡/파이프라인, MLflow(Model Registry), Feast(Feature Store) 운영 경험

크래프톤의 도전에 함께 하기 위해 아래의 전형 과정이 필요합니다.

  • 서류 전형 > 전화 인터뷰 (Phone Interview) > 직무 테스트 (Pre-Test) > 직무 면접 (Technical Fit Interview) > 종합 면접 (Culture Fit Interview) > 합격 및 입사
  • 상시채용으로 우수 인재 채용 시 조기에 마감될 수 있습니다.
  • 전형별 합격자에 대해 지원서에 등록하신 이메일 혹은 유선으로 개별 안내 드립니다.
  • 전화 인터뷰의 경우, 필수 전형이 아닌 필요에 따라 진행되는 선택 전형임을 사전 안내 드립니다. 이에 대한 상세 내용은 개별 안내 드립니다.
  • 필요 시 면접은 추가될 수 있으며, 이에 대한 상세 내용은 개별 안내 드립니다. 

필요 서류를 확인해주세요!

  • 입사지원서 (자유 양식), 성적증명서, 자기소개서, 경력기술서, 포트폴리오(필수)
  • 신입일 경우 자기소개서를, 경력일 경우 경력기술서를 중심으로 기술해 주시기 바랍니다.
  • 포트폴리오 첨부 시, 하단 안내 사항을 확인해 주시기 바랍니다. 

근무지

  • 역삼 센터필드

고용형태

  • 정규직 

아래 안내 사항을 확인해주세요!

  • 장애인 및 국가 유공자 등 취업 보호 대상자는 관계 법령에 따라 우대합니다.
  • 지원서 내용 중 허위사실이 있는 경우에는 합격이 취소될 수 있습니다.
  • 5개월의 수습기간을 적용합니다. 회사는 수습기간에 대한 평가 결과에 따라 본채용을 거부할 수 있으며, 수습기간 중이라도 중간평가 결과에 따라 수습기간을 조기 종료하고 본채용을 거부할 수 있습니다. 수습기간 내 고용형태 및 급여 조정은 없습니다. 
  • 채용 전형 중 궁금하신 사항은 크래프톤 채용 FAQ 내에서 확인하실 수 있습니다.

Be Bold, Learn And Win! 크래프톤의 성장과 도전의 스토리를 알아가고 싶다면?

Please Check The Information Below

  • Those eligible for an affirmative action program such as individuals with disabilities or with distinguished service to the state will be given hiring preference according to relevant laws
  • False statements in your resume may lead to the withdrawal of the employment offer
  • A 5-month probationary period applies. Based on the mid-term evaluation, employment may be terminated early or not continued. No changes in employment type or salary during this period.
  • Please contact career@krafton.com for other inquiries

Be Bold, Learn And Win! Would You Like To Explore Krafton’S Growth And Adventure Stories?

[Deep Learning Div.] Deep Learning Engineer - ML Ops (Infra) (5년 이상)

Office

Seoul

Full Time

September 8, 2025

company logo

KRAFTON