職位描述
該職位還未進行加V認證,請仔細了解后再進行投遞!
【崗位職責】
1、負責大模型技術團隊的建設與管理,制定技術路線與研發規劃;
2、主導大模型預訓練、微調、推理優化、領域適配等核心技術研發;
3、推動分布式訓練框架、高效微調(如LoRA)、模型壓縮等前沿技術攻關;
4、探索多模態大模型、Agent系統、模型安全對齊等創新方向;
5、跨部門協作推進技術落地,實現業務場景的規?;瘧?;
【崗位要求】
學歷背景:計算機科學、人工智能等相關領域碩士及以上學歷,2年以上AI研發經驗;
技術能力:
精通Transformer、MoE等模型架構,熟悉PyTorch/TensorFlow等框架
具備千億參數級大模型訓練調優經驗,熟悉Megatron/DeepSpeed等分布式框架
掌握RLHF、Prompt Engineering、模型評估等全流程技術
有AIGC、Agent系統或多模態大模型研發經驗者優先
行業視野:對LLM技術趨勢有深刻理解,在頂會(NeurIPS/ICML/ACL等)發表論文者優先;
工作地點
地址:深圳南山區深圳-南山區創維半導體設計大廈東座
??
點擊查看地圖
詳細位置,可以參考上方地址信息
求職提示:用人單位發布虛假招聘信息,或以任何名義向求職者收取財物(如體檢費、置裝費、押金、服裝費、培訓費、身份證、畢業證等),均涉嫌違法,請求職者務必提高警惕。

深圳
應屆畢業生
碩士
最近更新
1321人關注
注:聯系我時,請說是在河北人才網上看到的。
