AI 비용 최적화 / AI 반도체 솔루션 전문 스타트업 a2sys와 함께하는 새로운 도전에 초대합니다.
a2sys는 기존 LLM과 GPU 중심 서빙의 한계를 넘어 모델 최적화, 서빙 소프트웨어/시스템, 차세대 메모리를 하나로 연결하는 새로운 Agent-native Computing Solution을 구축하고자 합니다. 이를 위해 Agentic AI 서비스, LLM 학습/후공정, 분산 시스템, 런타임/컴파일러, 반도체 및 메모리 아키텍처 등 다양한 영역의 우수 인재들을 기다리고 있습니다.
사무실은 판교역에서 도보 10분 거리에 위치할 예정이며, 합류하시는 분들이 최고의 몰입을 경험하실 수 있도록 업계 최고 수준의 근무 환경과 복지, 처우를 준비 중입니다. 대한민국에서, 그리고 더 나아가 글로벌 시장에서 새로운 AI 시스템 생태계를 만들어갈 분들의 많은 지원과 관심을 부탁드립니다.
아래 표는 a2sys가 필요로 하는 경험/전문성을 기술합니다.
다만, 이것이 합격 후 하나의 직무에만 종사하게 됨을 말하지 않습니다.
| Area | Your Background | Your Stack |
|---|---|---|
| Agent Engineering 에이전트 엔지니어링 |
Agent Studio와 API를 관장합니다. 에이전트의 직접 구현·오케스트레이션·평가를 반복 수행하여 조직의 에이전트 역량을 누적하고, 그 과정에서 생성된 워크로드 데이터를 타 Core에 공급합니다. LLM 기반 tool-calling 구조를 신뢰할 수 있는 규모로 운용하는 방법에 대한 강한 의견이 있습니다. |
PythonFastAPILLM APIsLangChainMCP
Prompt Engineering |
| Model Engineering 모델 엔지니어링 |
회사 전반의 연구 흐름을 총괄합니다. 모델 아키텍처 연구·개조, KV 공유 가능한 모델 패밀리 설계, 평가 체계 구축으로 모델 자산의 품질·재현성을 책임집니다. 전사 Engineering Core의 연구 우선순위를 조율합니다. |
PyTorchSFTRLLLM ArchitectureEvals
|
| System Engineering 시스템 엔지니어링 |
능동형 KV 최적화 인프라를 관장합니다. 학습·서빙 인프라와 KV 호환·풀링 기반 inference stack을 구축·운영하여 모델 자산을 실속 가능한 cost·latency 우위로 전환합니다. |
PythonLLM InferenceCUDA
KubernetesDocker |
| Hardware Engineering 하드웨어 엔지니어링 |
차세대 메모리 스택을 주도합니다. 메모리 회사와의 co-design 협업을 주관하여 에이전트 워크로드에 최적화된 메모리 계층 구조를 선도·제안합니다. |
C++GPU Architecture
Memory SystemsCo-design |