2023年上半年：数据科学和人工智能发展

2023年07月17日由 Camellia 发表 671345 0

2023年的6个月就这样过去了。以下是2023年上半年主要数据科学和人工智能进展的回顾。

在2023年的前半年里发生了许多事情。数据科学和人工智能取得了重大进展，以至于我们无法跟上这些进展的速度。可以肯定的是，2023年上半年取得了我们之前没有预料到的快速进展。

所以，与其说我们是如何被这些创新吸引的，不如让我们来谈谈它们。

自然语言处理

我将从最显而易见的地方开始，即自然语言处理（NLP）。以前一直在暗中发展的东西，在2023年已经开始显露出来。

这些进展在OpenAI公司的ChatGPT中得到了证明，该系统一经发布就引起了轰动。自今年年初正式发布以来，ChatGPT已经从GPT-4即将升级到GPT-5。他们提供了插件，可以改进人们的日常生活，为数据科学家和机器学习工程师提供工作流程。

我们都知道在ChatGPT发布之后，谷歌推出了Bard AI，它在用户、企业等各方面都取得了成功。Bard AI一直在与ChatGPT竞争最佳聊天机器人的位置，提供类似的服务，例如改进机器学习工程师的任务。

在这些聊天机器人发布的同时，我们还看到了大语言模型（LLM）的凭空出现。由加州大学伯克利分校的学生和教师创立的开放研究组织大型模型系统组织（LMSYS Org）创建了聊天机器人Arena——一个LLM基准测试，通过使用开放数据集、模型、系统和评估工具的共同开发方法，使模型更加易于使用。

AutoML

现在人们已经习惯了使用聊天机器人来回答问题，让他们的工作和个人生活变得更轻松，那么数据分析师和机器学习专家呢？

他们一直在使用AutoML——一种功能强大的工具，用于数据科学家和机器学习工程师等数据专业人士，以自动化数据预处理、超参数调整，并执行复杂的任务，如特征工程。随着数据科学和人工智能的进步，我们自然会对数据和人工智能专业人员产生高需求。然而，由于进展速度快，我们看到了这些人工智能专业人员的短缺。因此，能够在自动化过程中探索、分析和预测数据将提高许多公司的成功率。

它不仅可以为数据专家节省时间，还可以使组织有更多时间来拓展和创新其他任务。

生成式人工智能

如果你经历了聊天机器人的爆发，你一定会听到“生成式人工智能”这个词。生成式人工智能能够基于用户提示生成文本、图像或其他形式的媒体。就像上述的进展一样，生成式人工智能正在帮助不同的行业完成任务，使他们的生活变得更轻松。

它具有生成新内容、替代重复任务、处理定制数据以及几乎生成任何你想要的内容的能力。如果你不了解生成式人工智能，你应该了解一下Stable Diffusion——它是生成式人工智能的基础。如果你是数据科学家或数据分析师，你可能已经听说过“PandasAI”——这是一个集成了生成式人工智能功能的开源Python库，用于更简化的数据分析。

但是随着这些生成式人工智能工具和软件的发布，我们还需要数据科学家吗？

深度学习

深度学习仍在蓬勃发展。随着数据科学和人工智能的最新进展，更多的时间和精力被投入到行业研究中。作为机器学习的一个子集，深度学习涉及算法和人工神经网络，广泛应用于图像分类、物体检测和人脸识别等任务中。

在我们经历第四次工业革命的过程中，深度学习算法使我们能够像人类一样从数据中学习。我们看到越来越多的自动驾驶汽车上路，欺诈检测工具、虚拟助手、医疗保健预测建模等等。

2023年已经证明了通过自动化过程、机器人、区块链和其他各种技术来展示深度学习的工作。

边缘计算

发生了这么多，你一定觉得这些电脑很累吧？为了满足人工智能和数据科学的进展，公司需要能够为其提供支持的计算机和系统。边缘计算使计算和数据存储更接近数据源。在使用这些先进模型时，边缘计算提供实时数据处理，并实现各设备间的顺畅通信。

例如，当LLM每两秒钟发布一次时，很明显企业需要像边缘计算这样的有效系统才能取得成功。谷歌今年推出了TPU v4——用于处理机器学习和人工智能的高计算需求的计算资源。

由于这些进展，我们看到越来越多的组织从云端转向边缘以适应它们当前和未来的需求。

道德人工智能和数据科学

发生了很多事情，而且发生在很短的时间内。对于政府等组织来说，跟上这些进展变得非常困难。来自世界各地的政府都在提出一个问题：“这些人工智能应用如何影响经济和社会，以及有什么影响？”人们关注人工智能和数据科学应用中的偏见和歧视、隐私、透明度和安全性问题。那么人工智能和数据科学的道德方面是什么，未来我们可以期待什么？

我们已经有了欧洲人工智能法案（European AI Act），该法案将人工智能系统分为4个风险领域。OpenAI公司的首席执行官Sam Altman曾在美国参议院委员会上就这一新技术的问题和可能的陷阱发表证词。尽管在短时间内发生了很多进步，但很多人对此表示担忧。在接下来的6个月里，我们可以期待更多的法律获得通过，更多的法规和框架出台。

总结

如果你在过去的6个月里没有关注人工智能和数据科学方面的进展，希望本文能够为你提供一个快速了解。在接下来的6个月里，当这些进展得到应用时，如何确保这些技术的负责任和道德使用将成为一个有趣的问题。

来源：https://www.kdnuggets.com/2023/07/first-half-2023-data-science-ai-developments.html

标签：

自然语言处理NLP 学习人工智能数据科学

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

下一篇 Wix AI网站生成器：创建专业网站从未如此简单

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

Meta Muse Spark 1.1：百万上下文瞄准多智能体