IBM受生物启发，创造了一个超越传统的人工智能

2020年01月22日由 TGS 发表 889151 0

听说过FlyHash吗？这个算法的灵感来自于果蝇的嗅觉回路，它可以产生哈希码——物体的数字表示，其性能优于经典算法。但非常可惜的是，由于FlyHash使用随机投影，它无法从数据中学习。

为了克服这一限制，普林斯顿大学、圣地亚哥大学、IBM Research和MIT-IBM Watson AI实验室的研究人员开发了BioHash，它应用“局部”和“生物学上合理的”突触可塑性规则，来生成哈希码。研究人员表示，它比之前发布的各种哈希方法基准测试都要好，而且它还可以生成对相似度搜索有用的二进制表示。

这种被称为扩展表征的现象在神经生物学中几乎无处不在。 “扩展”是指将高维输入数据映射到更高维的二次表示。例如，在上述果蝇嗅觉系统中，大约50个神经元会将它们的活动发送到约2500个细胞——凯尼恩细胞，从而实现约50倍的扩增。

从计算的角度来看，扩展可以增加AI模型的内存存储容量。正是基于这种动机，该团队设计了散列算法BioHash，可用于相似度搜索。在相似度搜索中，给定一个查询、一个相似度度量和一个包含任意数量项的数据库，就可以从数据库中检索与查询最相似的项的排序列表。FlyHash利用了LHS，BioHash也是如此。

但不同的是，BioHash速度更快，可扩展性也更强。

研究人员在MNIST和CIFAR-10上对Biohash进行了培训，以及测试。MNIST是一组包含7万张灰度图像的手写数字，其中10类数字从“0”到“9”不等，CIFAR-10是一个包含6万张来自10类数字的数据集。BioHash在速度方面表现出了最好的检索性能，远远超过了其他方法，而BioHash的改进版本——BioConvHash——由于加入了专门构建的过滤器，性能得到了进一步的提升。

团队断言：扩展表示之所以在生物中普遍存在，是因为它们把相似的刺激聚在一起，把不同的刺激分开。

事实已经证明，神经生物学和机器学习领域是密切相关的。

标签：

系统 AI模型

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇基于人工智能和机器学习的优化利用预测

下一篇 GitHub使用AI来推荐项目存储库中的开放问题

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

优化 LLM 提示的成本、延迟和性能的 4 种技术