机器学习在零售业中的十个关键应用

近年来,在封锁、宵禁、供应链中断和能源紧缩之间,零售商一定感觉很恐慌。但,幸运的是,零售业可以依靠全方位的技术创新来更好地应对这些困难时期的挑战。 这些技术中最有影响力的工具之一肯定是人工智能,包括其...
2年前
2540

稀疏特征和密集特征

在机器学习中,特征是指对象、人或现象的可测量和可量化的属性或特征。特征可以大致分为两类:稀疏特征和密集特征。 稀疏特征 稀疏特征是那些在数据集中不连续出现的特征,并且大多数值为零。稀疏特征的示例包括文...
2年前
2130

机器学习评估指标的十个常见面试问题

评估指标是用于评估机器学习模型性能的定量指标。它们提供了一种系统和客观的方法来比较不同的模型并衡量它们在解决特定问题方面的成功程度。通过比较不同模型的结果并评估其性能可以对使用哪些模型、如何改进现有模...
2年前
890

使用机器学习评估异质治疗效果

​译者 | 朱先忠 审校 | 孙淑娟 引言 在许多情况下,我们不仅对估计因果效应感兴趣,而且对不同用户的这种效应是否不同也感兴趣。我们可能有兴趣了解一种药物是否对不同年龄的人有不同的副作用。或者,我们...
2年前
710

Pytorch创建多任务学习模型

MTL最著名的例子可能是特斯拉的自动驾驶系统。在自动驾驶中需要同时处理大量任务,如物体检测、深度估计、3D重建、视频分析、跟踪等,你可能认为需要10个以上的深度学习模型,但事实并非如此。 HydraN...
2年前
580

图解最常用的十大机器学习算法!

在机器学习领域,有种说法叫做“世上没有免费的午餐”,简而言之,它是指没有任何一种算法能在每个问题上都能有最好的效果,这个理论在监督学习方面体现得尤为重要。 举个例子来说,你不能说神经网络永远比决策树好...
2年前
490

机器学习如何应对气候变化

近年来,人工智能(AI)因其彻底改变从医疗保健到金融等行业的潜力而成为头条新闻。但人工智能被证明特别有前途的一个领域是应对气候变化。机器学习是人工智能的一个子集,正被用于解决当今面临的一些最紧迫的环境...
2年前
460

一文读懂什么是机器学习

世界充满了数据——由人和计算机生成的图像、视频、电子表格、音频和文本充斥着互联网,将我们淹没在信息的海洋中。 传统上,人类分析数据以做出更明智的决策,并设法调整系统以控制数据模式的变化。然而,随着传入...
2年前
440

机器学习真能产生智能决策吗?

历经三年时间,我们在2022年完成了图灵奖获得者、加州大学洛杉矶分校计算机科学教授,美国国家科学院院士,被誉为“贝叶斯网络之父”的朱迪亚·珀尔大作《因果论:模型、推理和推断》。 这本书原版的第1版写于...
2年前
420

PathAI利用机器学习推动药物开发

​译者 | 朱先忠 审校 | 孙淑娟 位于美国波士顿的病理人工智能技术公司PathAI是病理学(疾病研究)人工智能技术工具和服务的领先供应商。他们开发的平台旨在利用机器学习中的现代方法,如图像分割、图...
2年前
420

使用马尔可夫链构建文本生成器

本文中将介绍一个流行的机器学习项目——文本生成器,你将了解如何构建文本生成器,并了解如何实现马尔可夫链以实现更快的预测模型。 文本生成器简介 文本生成在各个行业都很受欢迎,特别是在移动、应用和数据科学...
2年前
410

生成式AI应用的五大优势

生成式AI是指使用AI和机器学习算法使机器能够创建新的数字视频、图像、文本、音频或代码的技术。生成式AI由算法驱动,这些算法具有识别输入的底层模式、生成类似输出并提供高质量内容的潜力。一种更升级的生成...
2年前
390

机器学习正在赋能制药行业

机器学习一直在各个行业掀起波澜,包括制药行业。 通过利用先进的算法和大量数据,机器学习正在彻底改变药物的开发、制造和分销方式。在本文中,我们将探讨机器学习如何为制药行业赋能。 药物发现与开发 机器学习...
2年前
370

机器学习如何使农业更具可持续性

在气候迅速变化的时代,实现农业可持续性对于确保地球的健康和福祉至关重要。 由于资源有限,人口不断增加,传统的耕作方式已无法支持可持续的粮食系统。 好在,当前机器学习的技术进步为实现更可持续的农业实践提...
2年前
370

度小满自动机器学习平台实践

随着 AI 技术的发展,不同业务涉及的 AI 技术越来越多样,同时 AI 模型参数量逐年爆发式增长,如何克服 AI 算法落地面临的开发成本高、对人工依赖强、算法不稳定及落地周期长等问题,成为困扰人工智...
2年前
370

机器学习:73%的企业迷途求生

大家都知道,机器学习(ML)是人工智能的关键技术之一,也是一项逐渐走向成熟的应用技术。具体说来,这一技术可以为未来的数据科学带来变革,能够让应用企业作出基于更多数据分析的驱动决策,从而改善用户的业务体...
2年前
370

机器学习中实施随机森林算法的指南

随着机器学习模型在预测和分析数据方面变得越来越流行,随机森林算法的使用正在获得动力。随机森林是一种监督学习算法,用于机器学习领域的回归和分类任务。它的工作原理是在训练时构建大量决策树并输出类,即类的模...
2年前
350

机器学习模型和高斯过程的不确定性

介绍 让我们以一个例子来说明我们所面临的问题。想象一下,我们训练一个神经网络模型来预测包含汽车图像的概率。当我们使用这些概率来对有汽车的图像进行分类时,我们的模型有很好的准确性。在某些时候,我们给神经...
2年前
350

从机器学习中受益最大的四个行业

机器学习是人工智能的一个分支,具有最大的未来潜力并为行业带来最大的利益。据相关报告显示,到2025年,机器学习市场规模将达到967亿美元。与2018年的68亿美元相比,这将是一个巨大的增长。 在未来几...
2年前
350

机器学习理论基础到底有多可靠?

机器学习领域中,有些模型非常有效,但我们并不能完全确定其原因。相反,一些相对容易理解的研究领域则在实践中适用性有限。本文基于机器学习的效用和理论理解,探讨各个子领域的进展。 这里的实验效用是一种综合考...
2年前
350

为深度学习选择最好的GPU

在进行机器学习项目时,特别是在处理深度学习和神经网络时,最好使用GPU而不是CPU来处理,因为在神经网络方面,即使是一个非常基本的GPU也会胜过CPU。 但是你应该买哪种GPU呢?本文将总结需要考虑的...
2年前
330

使用PyTorch进行知识蒸馏的代码示例

随着机器学习模型的复杂性和能力不断增加。提高大型复杂模型在小数据集性能的一种有效技术是知识蒸馏,它包括训练一个更小、更有效的模型来模仿一个更大的“教师”模型的行为。 在本文中,我们将探索知识蒸馏的概念...
2年前
330

机器学习决策树实战演练

译者 | 朱先忠 审校 | 孙淑娟 机器学习中的决策树 现代机器学习算法正在改变我们的日常生活。例如,像BERT这样的大型语言模型正在为谷歌搜索提供支持,GPT-3正在为许多高级语言应用程序提供支持...
2年前
330

蔚来汽车深度学习算法实践

一、NIO Power 业务背景 1、蔚来汽车能源服务体系 NIO Power 业务团队的目标是构建全球创新的智能能源服务体系,基于移动互联网的加电解决方案,拥有广泛布局的充电换电设施网络,依托蔚来云...
2年前
320

机器学习必知必会十大算法!

1.线性回归 线性回归(Linear Regression)可能是最流行的机器学习算法。线性回归就是要找一条直线,并且让这条直线尽可能地拟合散点图中的数据点。它试图通过将直线方程与该数据拟合来表示自变...
2年前
320

机器学习超参调优:常用八种方法

机器学习算法需要用户定义的输入来实现准确性和通用性之间的平衡。这个过程称为超参数调整。有多种工具和方法可用于调整超参数。 我们整理了一份用于调整机器学习模型超参数的前八种方法的列表。 1.贝叶斯优化 ...
2年前
320

使用Scikit-lwarn的Imputer

​译者 | 布加迪 审校 | 孙淑娟 Imputer 如果您的数据集中有一些缺失值,您可能会删除缺失值行甚至列。强烈建议不使用这种方法,因为这会减少数据的大小,而且数据分析可能偏离事实。相反,我们应该...
2年前
310

人工智能如何诠释“眼睛是心灵之窗”

​利用机器学习开发的软件可以通过分析某人眼睛中的静脉和动脉,在不到一分钟的时间内预测某人患心脏病的风险。 这项新研究发表在《英国眼科学杂志》上。如果这项发现在未来的临床试验中得到验证,将为快速、廉价的...
2年前
310

基于TensorFlow和QuestDB的时间序列预测

​译者 | 朱先忠 审校 | 孙淑娟 时间序列预测的机器学习概述​ 当前,机器学习正在席卷全球,机器人能够以类似人类的精度完成许多领域中的任务。例如,在医疗领域,智能助手可以随时检查人们的健康状况;在...
2年前
310

机器学习如何防止列车延误

使用机器学习可以帮助预测列车延误,检测故障的早期迹象,并根据需求变化规划路线,可以在长期和短期内通过减少列车延误和确保高服务质量来改善铁路旅行。 晚点的列车影响着全世界数百万人,而运营商几乎不能做什么...
2年前
310

如何使用机器学习来分析情感

我们使用了不同的机器学习算法进行情感分析,然后将各个算法的准确率结果进行比较,以确定哪一种算法最适合这个问题。 情感分析是自然语言处理(NLP)中的一个重要的内容。情感指的是我们对某一事件、物品、情况...
2年前
300

用机器学习解决非结构化数据问题

​译者 | 布加迪 审校 | 孙淑娟 数据革命如火如荼。未来五年内创建的数字数据总量将是迄今生成的数据总量的两倍,非结构化数据将定义这个倡导数字体验的新时代。 非结构化数据指不遵循传统模型或不适合结构...
2年前
300

终于有人把分布式机器学习讲明白了

​分布式机器学习也称分布式学习,是指利用多个计算节点(也称工作节点,Worker)进行机器学习或者深度学习的算法和系统,旨在提高性能、保护隐私,并可扩展至更大规模的训练数据和更大的模型。 联邦学习可以...
2年前
300

机器学习中的集成方法概述

​想象一下,你正在网上购物,你发现有两家店铺销售同一种商品,它们的评分相同。然而,第一家只有一个人的评分,第二家有 100 人评分。您会更信任哪个评分呢?最终您会选择购买哪家的商品呢?大多数人的答案很...
2年前
280

用Python监测MLOps管道中的模型性能

点击参加51CTO网站内容调查问卷 译者 | 布加迪 审校 | 重楼 机器学习模型只有在生产环境中用于解决业务问题时才有帮助。然而,业务问题和机器学习模型在不断发展变化。这就要求我们维护机器学习,以便...
2年前
270

浅谈图嵌入算法

Part 01 ● 什么是图嵌入 ● 图嵌入是将图结构数据映射为低维稠密向量的过程,同时使得原图中拓扑结构相似或属性接近的节点在向量空间上的位置也接近,能够很好地解决图结构数据难以高效输入机器学习...
2年前
270

十个用于 AutoML 的 GitHub 存储库

人工智能和机器学习的突破是过去二十年中最激动人心的两个话题。机器学习和数据科学工程师需要广泛的研究和努力工作才能有效地理解和运行他们的模型。 虽然它们可能因人而异,但传统的机器学习步骤包括: 数据采集...
2年前
270

机器学习11种特征选择策略总结!

太多的特征会增加模型的复杂性和过拟合,而太少的特征会导致模型的拟合不足。将模型优化为足够复杂以使其性能可推广,但又足够简单易于训练、维护和解释是特征选择的主要工作。 “特征选择”意味着可以保留一些特征...
2年前
270

12个常用的图像数据增强技术总结

机器学习或深度学习模型的训练的目标是成为“通用”模型。这就需要模型没有过度拟合训练数据集,或者换句话说,我们的模型对看不见的数据有很好的了解。数据增强也是避免过度拟合的众多方法之一。 扩展用于训练模型...
2年前
270

机器学习如何彻底改变客户体验

机器学习通过增加更多的简单性、效率和生产力来改善客户体验。 客户体验(CX)是机器学习产生重大影响的一个领域,因为企业寻求利用这项技术与客户建立更加个性化、高效和有效的交互。在本文中,我们将通过解释企...
2年前
260

探索量子机器学习的未来:综合指南

量子机器学习是量子计算和人工智能交叉领域中一个快速发展的领域,有望彻底改变我们处理和分析数据的方式。随着世界越来越多地成为数据驱动,对更高效、更强大的计算系统的需求从未如此强烈。进入量子机器学习,其利...
2年前
260

机器学习正以惊人方式破解宇宙奥秘

太空旅行、探索和观测当中,往往涉及人类历史上最复杂、最危险的一系列科学与技术操作。在这些领域,人工智能(AI)已经证明了自己强大的辅助作用。 正因为如此,宇航员、科学家和其他以探索并记录终极边界为己任...
2年前
250

涨知识!用逻辑规则进行机器学习

Skope-rules使用树模型生成规则候选项。首先建立一些决策树,并将从根节点到内部节点或叶子节点的路径视为规则候选项。然后通过一些预定义的标准(如精确度和召回率)对这些候选规则进行过滤。只有那些精...
2年前
240

机器学习必备:如何防止过拟合?

其实正则化的本质很简单,就是对某一问题加以先验的限制或约束以达到某种特定目的的一种手段或操作。在算法中使用正则化的目的是防止模型出现过拟合。一提到正则化,很多同学可能马上会想到常用的L1范数和L2范数...
2年前
240

使用可视化工具和统计方法检测异常值

异常值(离群值)是指距离其他数据值太远的数据值。数据异常值可能是自然产生的,也可能是由于测量不准确、或系统故障造成的。与缺失值类似,异常值会破坏数据科学项目并返回错误的结果或预测。异常值也可能出现在倾...
2年前
240