職位描述
職位描述:1、 設計和實現分布式機器學習模型訓練的基礎設施,包括數據的分布式處理和計算、分布式訓練框架的搭建和優化。2、 設計并實現AI Infra的計算、存儲、網絡架構及AI應用的通信、I/O效率優化方案,并系統化落地。3、熟悉至少一種模型分布式運行框架,包括各種分布式并行算法及容錯處理機制。4、熟悉一種集合通信庫,包括主流的集合通信算法的實現(如NCCL)。5、熟悉GPU上算子編程與優化(如CUDA,Cutlass, Cute, Triton, Flash Attention等)者優先考慮。6、研究和應用GPU加速技術,優化AI計算平臺的性能,并開發相應的工具庫。7、負責AI計算平臺的架構和優化,保證擴展性、穩定性。職位要求:1、本科及以上學歷,計算機相關專業,AI相關5年以上開發經驗;2、扎實的分布式開發經驗,熟悉分布式計算和存儲相關概念和技術;3、了解AI計算平臺的架構和實現原理,有相關項目經驗者優先;4、精通至少一個深度學習訓練框架的底層架構和機制,精通pytorch框架最佳;5、熟練掌握相關AI網絡技術和容器技術。
企業介紹
酷哇科技,專注于城市復雜場景下自動駕駛技術的研發和智能網聯城市服務的應用。?酷哇擁有整車裝備制造、軟件算法研發和智能網聯服務三重優勢,是國內L4級自動駕駛商用車領域頭部企業。酷哇和奇瑞、北汽、陜汽、中聯等主機廠達成戰略合作,聚焦市政環衛、城配物流和城市出行三大領域,布局L4級自動駕駛產品和服務,已成功實現規模化商業落地。酷哇堅持裝備制造和城市服務雙融合的發展模式,截止到2022年中,公司營業收入復合增長率均保持在300%以上,基于L4自動駕駛城市營運服務訂單總額已達十億級別。酷哇作為國內首批自動駕駛城市服務運營商,已經在全國10余個重要的地級市開展常態化自動駕駛營運服務,目前L4級別自動駕駛車隊規模近千臺,為自動駕駛技術的研發提供了可靠性數據積累。?酷哇在上海(徐匯、嘉定)、蕪湖、長沙、西安均設有研發中心,擁有多個規模化的超算中心,研發團隊近500人。同時,酷哇在蕪湖、揚州、金華等地設有裝備制造基地,為酷哇城服業務提供自動駕駛裝備產能支撐。酷哇致力于將自動駕駛及新能源技術賦能城市生活,在助力”雙碳“目標達成、推動行業降本增效、提升社會效益方面積極履行社會責任,構建更高效、更舒適、更美好的城市生活,讓更多市民體驗到自動駕駛駕駛產品,享受技術變革對安全、環境和生活帶來的持續改善。