数据挖掘专家,哪些数据分析和数据挖掘的牛人(18)


最后还有一个问题:如何导出数据?这意味着检测计算机的量子状态,一次检测不仅只能一次返回一个随机抽取的数字,而且还会使整个状态崩溃,在你还没来得及收回数据之前,其他的数据就已被清除 。你只能再次一遍又一遍地执行算法,以收回所有信息 。
不过并不是没有希望 。在某些问题中,你可以利用量子干涉(quantum interference) 。也就是说,你可以设计运算过程,使错误的答案自行消除,并巩固正确的答案 。这样,当检测量子状态时,计算机就会给出你想要的数值,而不是随机数值 。但是只有少数算法(例如蛮力搜索算法brute-force search)可以很好地利用量子干涉,而且速度是适中的 。
在某些任务中,研究人员发现了输入和输出数据的快捷方法 。2015年,Lloyd、加拿大滑铁卢大学的Silvano Garnerone和南加州大学的Paolo Zanardi证明了:在某些类别的统计分析中,不需要输入或存储整个数据集 。同样,当几个关键数值就可以满足需求时,不需要读取所有数据 。例如,科技公司根据庞大的消费者习惯数据,利用机器学习来矩阵为用户建议节目或者商品 。“Netflix或亚马逊(Amazon)并不需要获取到处生成的矩阵,它们要做的只是为用户生成建议 。” Aaronson称 。
所有这些引出了这样一个问题:如果量子计算机只在某些特殊任务中表现优秀,传统的计算机是否也能胜任这些任务?这是量子计算领域的一个还未解决的大问题 。毕竟普通的计算机也十分强大 。处理大型数据集的常用方法——随机采用,在本质上与量子计算机十分类似,即:无论系统内部进行何种运算,最终返回的结果都是随机的 。Schuld称:“我研究出来的很多算法常常让我感到‘它们太棒了,我们这下可以提升运算速度了’ 。不过我为了好玩又编写了一个在传统计算机上运行的抽样算法,我发现用抽样算法也可以实现相同的效果 。”
如果回顾量子机器学习目前为止的成果,你会发现它们都带有星号 。以D-Wave计算机为例:当分类汽车图像和希格斯粒子时,D-Wave计算机的速度并不比传统的计算机快 。“我们在这篇论文中没有谈到的一个问题是量子加速 。” Google DeepMind团队的计算机科学家Alex Mott表示 。他曾经是Higgs研究团队的一员 。矩阵代数方法(例如Harrow-Hassidim-Lloyd算法)只有在矩阵为稀疏矩阵(多数元素为零)时才会实现量子加速 。“在机器学习中稀疏数据集是否真的有趣?从没有人问过这个问题 。” Schuld表示 。
量子智能
话说回来,现有的方法偶尔有什么进展,科技公司们就会感到十分高兴 。“我们看到的这些优势都不算大;它们虽然不是指数性的,但是至少是二次的”微软研究院(Microsoft Research)的量子计算研究院Nathan Wiebe称 。“如果量子计算机足够大、足够快,我们就可以彻底改变机器学习的许多领域 。”在应用这些系统的过程中,计算机科学家可以解决一些理论性难题——这些系统是否在本质上更快,原因是什么 。
Schuld还看到了量子计算在软件方面的创新空间 。机器学习不仅仅是计算问题,而且还是很多问题交缠在一起,每个问题都有自己特殊的结构 。“人们编写的算法被从使机器学习变得有趣和美丽的事物中移除 。这就是为什么我开始探索其他方法和思考的原因:如果有了量子计算机(小型的),它可以运行什么机器学习模型?也许这样的模型还没有发明出来 。” Schuld说 。如果物理学家想要让机器学习专家刮目相看,除了构建现有模型的量子版模型外,他们要探索别的突破 。
许多神经科学家现在认为人类思维的结构反映了身体的要求,实际上机器学习系统也囊括万千 。这些系统所处理的图像、语言和大多数其他数据都来自于真实世界,这些数据反映了世界的种种特征 。同样,量子机器学习系统也是包罗万象的,它所反映的世界要远远大于我们的世界 。毫无疑问,量子机器学习系统将在处理量子数据上大放光彩 。当数据不是图像,而是物理学或化学实验的产物时,量子计算机将会大显神通 。如果解决了数据输入问题,传统的计算机就将会被完全淘汰 。

推荐阅读