数据挖掘专家,哪些数据分析和数据挖掘的牛人(16)


D-Wave Systems公司制造的用于机器学习应用的处理器
在运行系统时,必须先施加一个水平的磁场,这个磁场可以将qubit预置为向上和向下的均等叠加——等同于空白状态 。输入数据的方法有好几种 。在某些情况中,你可以将某一层qubit固定在预期的输入值;不过多数情况下,应将输入导入到qubit的相互作用的范围内 。然后让qubit相互作用 。某些qubit朝同一方向排列,某些qubit朝相反方向排列,在水平磁场的作用下,它们会翻转到它们选择的方向 。通过这样做,这些qubit可以触发其他qubit进行翻转 。由于很多qubit都没对准方向,刚开始时会发生很多翻转 。等到翻转停止后,你可以关闭水平磁场,将qubit锁定在固定位置 。此时,qubit处于朝上和朝下的叠加状态,这种状态可以确保输出与输入相对应 。
关键在于,Qubit最终的排列方式很难预测出来 。通过完成自然出现的任务,系统可以解决普通计算机难以解决的问题 。“我们不需要使用算法 。这种系统与常规的编程完全不同 。系统本身可以解决问题 。” 东京工业大学的物理学家Hidetoshi Nishimori解释道 。D-Wave计算机的工作原理就是由Hidetoshi Nishimori提出的 。
qubit的翻转是由量子隧穿效应(quantum tunneling)驱动的 。这种效应是一种自然趋势,量子系统必须要选出最佳配置,不能退而求其次 。你可以构建一个工作原理相似的传统网络,采用随机晃动,而不是通过隧穿效应来让bit翻转 。在某些任务中,这样的网络表现更好 。但是有趣的是,在处理机器学习中出现的问题时,量子网络实现最佳结果的速度似乎更快 。
D-Wave计算机也有缺陷 。在当前的配置下,D-Wave计算机的噪声非常大,它只能执行有限的操作 。而机器学习算法本质上是具有容噪能力的,它们可以理解混乱的现实环境,在干扰性背景中从区分小猫和小狗 。“神经网络对噪声有很强的鲁棒性 。” Behrman称 。
Hartmut Neven是谷歌的一名计算机科学家,他开创了增强现实技术,是谷歌Google Glass项目的联合创始人 。后来,他领导一个团队开始研究量子信息处理 。2009年,这个团队证明了一台初期的D-Wave 计算机可以很好地完成一个机器学习任务 。他们将这台计算机用作为一个单层神经网络,在20000张街景图数据库中将图像分类为两个类别:“汽车”和“非汽车”(请记住:这台D-Wave计算机与2018年上线的50-qubit系统属于完全不同的机型 。) 。Neven的团队结合使用D-Wave 计算机与传统的计算机,他们分析了图像的各种统计参数(quantities),然后计算这些参数对图像中汽车的敏感度——通常不是很敏感,但至少比抛硬币(猜正反面)要好 。这些参数的某些组合可以准确地识别出汽车,但是无法识别出具体车型——这是神经网络的任务 。
这个团队为每个参数都分配了一个qubit 。如果qubit的值稳定在1,则将相应的参数标记为有用;如果qubit的值稳定在0,则不用标记 。Qubit的磁力相互作用可以编码问题的要求,例如:只包含区分作用最强的参数,以确保参数的最终选择尽可能简单明了 。试验的结论是,D-Wave计算机可以识别出汽车 。
去年,加州理工学院粒子物理学家Maria Spiropulu和南加州大学物理学家Daniel Lidar领导的一个团队将算法应用到粒子物理学问题中:将质子碰撞分类为“希格斯玻色子(Higgs boson)”和“非希格斯玻色子” 。这个团队将研究对象选择为生成质子的碰撞,他们使用基本的粒子理论来预测哪些粒子属性可能会表征希格斯粒子的短暂存在,例如:超出动量的某些阈值 。他们考虑了8种粒子属性和28种属性组合,一共是36种候选信号然后让南加州大学的新型量子计算机找出最佳选择 。该计算机识别出16个有用的变量,3个最佳变量 。该量子计算机在执行准确的分类任务时比标准流程所需的数据量要少 。“在训练集较小的条件下,量子计算方法的准确度要比高能物理学中的传统方法高 。”Lidar表示 。

推荐阅读