AI研究方向选择全解析,为你解锁人工智能世界

摘要: 想要了解人工智能的研究方向选择吗?本文全面解析AI的算法层面、子领域层面以及工业界需求大方向,帮助你理清AI的宏观层面,并为你打开人工智能世界之门。

一.前言

最近在面对选择研究方向的问题,研究生选方向是一件至关重要的事情。通过咨询许多资深人士,我逐渐理清了人工智能(AI)的大致方向。这篇文章旨在分享我对AI宏观层面的理解,虽然不能称为科普文,但希望对即将选择导师、实验室、研究方向的同学们,以及考虑转行和自学的朋友有所帮助。

适用读者: 对AI领域感兴趣,希望加入这一浪潮的同学们,同时对各个子方向不太了解的人。

AI子方向
AI子方向

有没有觉得这个良心配图好好看哇!!活泼个性而不失严谨!!! 那就点个关注吧!!

二.算法层面

AI与数据和算法密不可分,算法层面主要涉及到 机器学习(ML)深度学习(DL)强化学习(RL)。在早期的人工智能阶段,AI相当于统计学 + 数据挖掘 + 算力 + 计算机科学的综合体。随着算力的提升,特别是在2012年左右,反向传播算法使深度学习进入了大众视野。2016年,通过强化学习的应用,AlphaGo战胜了李世石,使AI一词开始走红。在此后的发展中,深度学习不断颠覆,涌现了视觉领域的yolo家族、CNN、RCNN家族,以及强化学习的DQN,NLP领域的Bert等。

三.子领域层面

个人理解中,AI的主要方向包括 计算机视觉自然语言语音知识图谱 等几大方向。要构建一个完整的AI,需要涉及到视觉、听觉、语言、记忆推理认知等模块,还有躯体模块,如机器手臂和传感器。因此,AI相应地分为以下几个子领域,它们之间存在重叠和相互依赖。

计算机视觉(CV): 研究机器如何看,是处理图像识别、理解、目标跟踪、检测等问题的科学。CV的子方向包括目标检测、目标识别、图像分类、图像分割、姿态估计、SLAM等。应用场景广泛,涵盖了自拍美颜、人脸识别、指纹解锁、自动驾驶、安防等领域。

自然语言处理(NLP): 涉及语言的理解、认知,主要方向包括中文自动分词、文本分类、情感分析、问答、对话、信息检索、机器翻译等。与CV相比,NLP应用场景较少但复杂度更高,未来可能成为研究的热点方向。

语音识别(VC): 解决从多个声音中筛选出目标声音的问题,应用于微信聊天的语音识别、英语流利说的发音打分等。

知识图谱(KG): 是一种语义网络,将实体用关系串联起来,进行知识推理,使得AI更具可解释性。KG是智能体的记忆推理认知模块,也是重要的方向。

总结一下,科学家要构建智能体,需要分别搭建其视觉、语言、听觉、记忆推理认知等模块,而这些模块也分别对应着各自的领域和方向。

四.工业界需求大方向

对于其他方向了解有限,因此不进行详细介绍。对于NLP方向,真正能给企业带来实实在在收益的技术包括搜索、问答、推荐系统和计算广告。这些领域在互联网大厂中已经取得了稳定而成熟的应用。

工业界落地场景
工业界落地场景

  • 搜索: 百度搜索引擎、Google搜索,以及许多成熟的网页和APP都需要自己的搜索功能。
  • 推荐: 字节跳动、淘宝、美团等通过个性化推荐提供用户喜好的内容。
  • 计算广告: Facebook等通过广告实现了大部分的收入,广告和推荐有交叉之处,根据广告主的需求调整广告出现位置,提高广告点击率等。
  • 智能问答: 任务式问答,如智能客服、医院挂号问答机器等,在未来需求会不断增长。
© 版权声明
THE END
喜欢就支持一下吧
点赞14 分享