工作內(nèi)容
1負(fù)責(zé)主流具身智能相關(guān)數(shù)據(jù)(如感知多模態(tài)動(dòng)作控制物理交互等)的收集分析與自動(dòng)化清洗流程的設(shè)計(jì)和實(shí)施,制定數(shù)據(jù)清洗標(biāo)準(zhǔn);
2參與構(gòu)建和優(yōu)化數(shù)據(jù)平臺(tái)相關(guān)功能模塊(如數(shù)據(jù)標(biāo)注驗(yàn)證維護(hù)系統(tǒng)),保障數(shù)據(jù)的質(zhì)量完整性與可追溯性;
3與算法團(tuán)隊(duì)緊密合作,深入理解具身數(shù)據(jù)特性,推動(dòng)高質(zhì)量具身智能模型的訓(xùn)練與評(píng)估;
4梳理和反饋數(shù)據(jù)采集過(guò)程中的標(biāo)準(zhǔn)與問(wèn)題,提出采集策略優(yōu)化方案,提高數(shù)據(jù)采集的效率和有效性;
5跟蹤具身智能領(lǐng)域前沿?cái)?shù)據(jù)集與數(shù)據(jù)標(biāo)準(zhǔn),參與團(tuán)隊(duì)數(shù)據(jù)策略與技術(shù)規(guī)范的制定。
任職要求
1具備扎實(shí)的數(shù)據(jù)工程能力,具備數(shù)據(jù)挖掘數(shù)據(jù)分析數(shù)據(jù)建模等相關(guān)經(jīng)驗(yàn);
2熟悉常見(jiàn)大數(shù)據(jù)處理工具與框架(如 Hadoop, Spark, Hive, Airflow 等),具有并行/分布式數(shù)據(jù)處理經(jīng)驗(yàn);
3熟悉 Python / SQL / Shell 等語(yǔ)言,掌握至少一種主流數(shù)據(jù)處理框架(如 PandasPySparkDask 等);
4熟悉數(shù)據(jù)標(biāo)注數(shù)據(jù)驗(yàn)證數(shù)據(jù)版本控制等流程,有構(gòu)建數(shù)據(jù)管線和數(shù)據(jù)平臺(tái)的實(shí)際經(jīng)驗(yàn);
5有機(jī)器人系統(tǒng)相關(guān)經(jīng)驗(yàn)者優(yōu)先;
6在具身智能相關(guān)方向有開(kāi)源項(xiàng)目貢獻(xiàn),或在頂級(jí)會(huì)議(如 ICRACoRLRSSNeurIPSCVPR 等)有論文發(fā)表記錄者優(yōu)先;
7有兩年以上相關(guān)工作經(jīng)驗(yàn)者優(yōu)先,具備較強(qiáng)的溝通能力與跨團(tuán)隊(duì)協(xié)作意識(shí)。
職位類別:
舉報(bào)