如何顺利拿到 NLP 算法工程师 Offer ?

相比于计算机视觉,NLP 算法的发展和在工业界的落地都有一定的不饱和性,正处于飞速发展的阶段,是一个拥有比较大的发展空间的计算机领域。想成为 NLP 算法工程师,需要点亮哪些技能呢?再多的废话都不如各个大厂的招聘公告来得直接啦~

这里是某个大厂招聘 NLP 相关算法工程师的不同层次的不同要求。

  • AI Lab 科学家 NLP 方向
  • AI Lab 算法工程师 NLP 方向
  • AI lab NLP 应用研发工程师
  • 对于偏向研究的科学家岗位,要求在 NLP 的某个具体领域有比较突出的研究成果,顶会论文是必要的,论文的质量和数量以及研究的深度是最重要的考察因素。要在工作中能有独立开展工作和研究的能力。当然,编程能力也是有一定要求的,毕竟公司工作的最终目的还是希望能落地成产品。所以,编程能力体现在:有一定的研究成果后能够尽快进行实验,验证想法的有效性。
  • 一般的算法工程师岗位,要求理论和工程并重。理论方面:并没有要求研究方向上有及其突出的成果,但要求在 NLP 的某个方向上有一定的经验,而且能够快速学习,在短时间内理解最新的算法。另外,要有比较好的数学基础。工程方面:明确要求动手能力比较强。
  • NLP 应用研发工程师,理论方面要求比较低,只要有相关的经验即可,但对编程能力要求相对较高。以产品和开发为导向。

这三个岗位要求展现了从偏向理论到偏向工程的逐步变化,到底是选择偏理论的方向努力还是选择偏向实践的方向走,那主要看自己的爱好了。下面为大家在学习过程中可能遇到的一些问题提供一些建议,帮助大家以最快的速度补充和提高自己。

必要的机器学习和 NLP 基础

机器学习和 NLP 基础是是必不可少的。Stanford CS224n Natural Language Processing with Deep Learning 以及 Stanford CS224d Deep Learning for Natural Language Processing。这两门课基本囊括了 NLP 的基础知识以及深度学习方法在 NLP 领域的应用。

方向

自然语言处理主要涉及语音识别、语音合成、语义理解、机器翻译等方向。

语音识别

目前语音识别的技术成熟度较高,已达到 95%的准确度,但背景噪音仍难解决,实际应用仅限于近距离使用。科大讯飞语音识别成功率达到 97%,离线识别率亦达 95%。百度、思必驰等企业均推出了各自基于语音交互的产品,其中以输入法、车载语音、 智能家居、教育测评最为普遍。

机器翻译

机器翻译是当前最热门的应用方向,由于自然语言语义分析的复杂性,翻译水平还远不能和人类相比。由于深度学习的发展,机器翻译技术有了显著的提高,目前机器翻译是 NLP 的热点之一,各大互联网公司都相继推出了自己的翻译系统,谷歌、微软、有道、科大讯飞、百度、搜狗等均上线或更新了翻译产品。

知识图谱

知识图谱概念由谷歌 2012 年正式提出,其初衷是为了提高搜索引擎的能力,改善用户的搜索质量以及搜索体验。知识图谱是具有向图结构的一个知识库,其中图的节点代表实体或概念,而图的边代表实体/概念之间的各种语义关系。目前,知识图谱是 NLP 的热点之一,现已被广泛应用于智能搜索、智能问答、个性化推荐等领域。知识图谱在工业界的应用大概可以分为三个主要的方向:

(1)在 语义搜索 方面,由于知识图谱所具有的良好定义的结构形式, 语义搜索利用建立大规模数据库对关键词和文档内容进行语义标注, 从而改善搜索结果。

(2)在 知识问答 方面,基于知识图谱的问答系统通过对用户使用自然语言提出的问题进行语义分析和语法分析,进而将其转化成结构化形式的查询语句,然后在知识图谱中查询答案。

(3)在 分析与决策 方面,利用知识图谱可以辅助行业和领域的大数据分析和决策。

从零开始新领域的新项目

在选定自己喜欢的方向后,就可以开始着手做项目了,让自己在实践中熟悉理论知识,加深认知。那么,在没什么基础的情况下,该如何开始自己的第一个项目呢?微软亚洲研究院的周明博士提出的建议我觉得还是非常适合第一次上手的人,在这里分享给大家:

(1)在 Github 或者其他开源社区找一个该方向的项目。

(2)理解项目背景和项目任务,然后编译通过该项目发布的示范程序,得到与项目示范程序一致的结果。

(3)深入理解开源项目示范程序的算法。

(4)自己编程实现一下这个示范程序的算法。

(5)按照项目提供的标准测试集测试自己实现的程序。如果输出的结果与项目中出现的结果不一致,就要仔细查验自己的程序,反复修改,直到结果与示范程序基本一致。

(6)如果还是不行,就大胆给项目的作者写信请教。在此基础上,再看看自己能否进一步完善算法或者实现,取得比示范程序更好的结果。

如何快速了解某个领域

最有效、简单、粗暴的方法:Google Scholar中搜索“领域名称 + survey/review/tutorial/综述” 进行查找。从文献综述中可以了解到该领域在整个发展历程中重要的算法、相关的论文,以及最新的研究成果。基本可以大致了解都是哪些组,哪些人在做这个方向。

如果方向太新还没有相关综述,一般还可以查找该方向发表的最新论文,阅读它们的“相关工作”章节,顺着列出的参考文献,就基本能够了解相关研究脉络了。

有了以上两个策略,NLP 工程项目和理论方面都能兼顾了。剩下的,就要靠自己的坚持和自律了。当然,还有编程能力方面,希望大家都能给自己立下 Flag,每周可以在 力扣 上刷多少道题?

力扣

本文作者:宋娜

声明:本文归 “力扣” 版权所有,如需转载请联系。

文中部分图片来源于网络,为非商业用途使用,如有侵权联系删除。

发表回复

相关推荐

罕见国企硕鼠,边贪三亿,边举报他人,被查吓哭:请求组织原谅

今天讲一个身居高位的国企总经理,享受副厅级待遇,却因为两大爱好,最后落了个被判死刑的可悲结果。说起他的这两个爱好,真 ...

· 36分钟前

【2023年双11更新】汽车贴膜选购攻略,哪些太阳膜值得买?最值得推荐的汽车贴膜!

我平时喜欢研究汽车用品,备胎已经被我扔到了床底下,我是 @广哥聊汽车,欢迎关注我,有问题欢迎留言讨论。

· 36分钟前

膽礬的化學式及知識點介紹

膽礬又稱五水合硫酸銅,膽礬的化學式,膽礬的功效和作用又是什麼瞭?下面來一起瞭解一下膽礬吧。1、膽礬的化學式化學式:CuSO4...

· 38分钟前

11人拯救整個世界 二戰著名特種作戰行動 重水之戰

11人拯救整個世界 二戰重水之戰http://www.icpchaxun.com/video/1049796177821855744這期我們來給大傢講述,戰地V 北極之光 ...

· 38分钟前

2023年(双11)4000元左右手机推荐/3500-4500/拍照旗舰手机/父母/学生/拍照/游戏/续航/性能好/性价比/小米/vivo/iQOO/华为/荣耀/OPPO/三星/真我

2023年11月7日新增 iQOO 12 2023年10月26日新增小米14 2023年10月24日更新双11活动价格 2023年10月8日更新机型价格 2023年5 ...

· 50分钟前