李先刚 xiangangli.speech@hotmail.com
教育经历
- 2010.09 - 2015.07, 北京大学计算机科学与技术(智能科学与技术)博士生
擅长与研究兴趣
- 大模型、深度学习、机器学习与数据挖掘、自然语言处理、语音识别与合成
- AI 算法探索与产业落地、算法技术规划和管理
工作经历
- 2023.07 - 2023.11 零一万物科技有限公司联合创始人 & 算法副总裁
- 公司算法负责人:负责大模型预训练(pretrain)和调优(finetune、align 等),包括数据处理(6T tokens+)、模型训练框架(megatron based)、模型调优等
- 2020.10 - 2023.06, 贝壳高级研究员(P11), 贝壳策略算法中心负责人
- 统筹负责贝壳集团策略算法,推动策略算法能力(含 AI 能力)在集团各个业务场景下的规划与应用。下属五个中心:B 端智能应用(包含商机分配、智能调度、小贝助手等)、C 端智能应用(包含搜索、推荐、投放、用户画像等)、品质风控研发(风控中台与策略等)、AI 基础技术(语音、文本、图像等)、智能产品。
- 带领规划和研发贝壳大模型技术的积累和应用,其中重点在房产经纪领域和装修设计领域。
- 推动 BELLE 大模型开源项目(github.com/LianjiaTech/BELLE,7k stars),在增量预训练、SFT 等方向为开源社区带来一定的贡献,促进了国内大模型技术的发展,BELLE开源的代码和数据被大部分大模型团队采用。
- 2017.11 - 2020.10, 滴滴首席算法工程师 & 滴滴语音语义技术部总监
- 带领滴滴出行 CTO 线语音和 NLP 的中台技术团队,负责相关技术的研发和业务落地。重点工作包括:滴滴行程录音、语音与 NLP 相关技术平台、舆情监控与分析中台、智能客服解决方案、车载智能交互平台等。
- 2018 年 9 月,负责实现网约车行程中的全程录音功能以及基于此的相关安全识别管控差旅。该功能显著提升了网约车平台的出行安全性,并已经成为了中国网约车行业的标配
- 2015.07 - 2017.11, 百度语音技术部语音识别技术负责人
- 2016年,百度语音技术部识别技术迭代,以及DeepSpeech中文方面应用
- 语音识别、说话人识别、语音信号处理、麦克风阵列算法等研发工作(重点包括其在百度语音搜索、语音输入法、地图语音识别、度秘语音识别等产品中的识别性能提升)
- 2017年,实现端对端说话人识别系统(DeepSpeaker系统),其将人脸识别中的一些深度学习算法引入到说话人识别中
个人或团队部分奖励和成果
- 2022, 带领团队参加ICASSP 2022 ADD,获得两项任务评测第一
- 2022, 带领团队参加SemEval 2022, 在task 4多分类子任务中评测第一
- 2020, 第20届全国青年岗位能手
- 2020, 带领团队参加DSTC9 (the 9th Dialog System Technology Challenge), 端到端多领域任务型对话任务评测第一
- 2017, 百度最高奖团队成员
- 2016, 《麻省理工科技评论》年度十大突破技术Deep Speech系统负责人之一
- 2016, 百度潜力股
- 2014, ISCSLP 2014 最佳学生论文
- 2013, 参加Blizzard Challenge国际语音合成竞赛,在竞赛的各个指标中取得了领先
- 2010 - 2015, 北京大学校长奖学金(北京大学博士生最高荣誉)
- Google scholar citation: 5000+