五分钟技术趣谈 | 机器学习的前世今生 Part 01 机器学习是什么? 实现人工智能的方法我们称之为“机器学习”,在1956年的美国达特茅斯会议上,Arthur Samuel正式提出了“Machine Learning”这个概念。机器学... 人工智能# 机器学习 2年前620
机器学习如何彻底改变医疗保健行业? 其中,医疗保健行业一直是一个强大的赞助者,并张开双臂采用了新技术。它正在通过实施人工智能和机器学习而受益和转变。该行业已经将大数据工具应用于高级数据分析,现在机器学习已做好一切准备,以帮助他们在初始患... 人工智能# 机器学习 2年前190
大语言模型的视觉天赋:GPT也能通过上下文学习解决视觉任务 当前,大型语言模型(LLM)已经掀起自然语言处理(NLP)领域的变革浪潮。我们看到 LLM 具备强大的涌现能力,在复杂的语言理解任务、生成任务乃至推理任务上都表现优异。这启发人们进一步探索 LLM 在... 人工智能# 机器学习 2年前450
Midjourney和Other Diffusion模型如何从随机噪声生成图像 译者 | 朱钢 审核 | 重楼 扩散模型(如Midjourney和DALL-E 2)可以生成令人惊叹的图像,但它们的训练始终从完全的噪声开始。 每当机器学习(ML)领域取得进展或发生微小变化时,就会引... 人工智能# 机器学习 2年前190
机器学习和物联网的交叉:智能设备和预测分析 智能家居的未来:集成机器学习和物联网,以增强预测分析。 机器学习和物联网(IoT)的交叉正在彻底改变我们生活、工作以及与环境互动的方式。这种技术融合使智能设备的发展成为可能,这些设备可以从周围环境中学... 人工智能# 机器学习 2年前310
机器学习如何彻底改变客户体验 机器学习通过增加更多的简单性、效率和生产力来改善客户体验。 客户体验(CX)是机器学习产生重大影响的一个领域,因为企业寻求利用这项技术与客户建立更加个性化、高效和有效的交互。在本文中,我们将通过解释企... 人工智能# 机器学习 2年前260
量子机器学习Variational Quantum Classifier (VQC)简介 变分量子分类器(Variational Quantum Classifier,简称VQC)是一种利用量子计算技术进行分类任务的机器学习算法。它属于量子机器学习算法家族,旨在利用量子计算机的计算能力,潜... 人工智能# 机器学习 2年前250
关于OpenAI Gym的定义和使用 译者 | 布加迪 审校 | 重楼 如果您无法从头开始构建一个机器学习模型,或者缺少相应的基础设施,仅仅将应用程序连接到工作模型就可以填补这个缺口。 人工智能可供所有人以某种方式来使用。至于OpenAI... 人工智能# 机器学习 2年前160
基于信息论的校准技术,CML让多模态机器学习更可靠 多模态机器学习在各种场景下都取得了令人瞩目的进展。然而,多模态学习模型的可靠性尚缺乏深入研究。「信息是消除的不确定性」,多模态机器学习的初衷与这是一致的——增加的模态可以使得预测更为准确和可靠。然而... 人工智能# 机器学习 2年前310
机器学习正以惊人方式破解宇宙奥秘 太空旅行、探索和观测当中,往往涉及人类历史上最复杂、最危险的一系列科学与技术操作。在这些领域,人工智能(AI)已经证明了自己强大的辅助作用。 正因为如此,宇航员、科学家和其他以探索并记录终极边界为己任... 人工智能# 机器学习 2年前250
使用 NLPAUG 进行文本数据的扩充增强 在机器学习中,训练数据集的质量在很大程度上决定了模型的有效性。我们往往没有足够的多样化数据,这影响了模型的准确性。这时数据增强技术就派上了用场。 数据增强可以通过添加对现有数据进行略微修改的副本或从现... 人工智能# 机器学习 2年前170
苹果 WWDC23 不提“人工智能”,更倾向使用“机器学习” 6 月 6 日消息,苹果公司在周一的 WWDC 2023 主题演讲中,除了发布了备受期待的 Mac Pro 和 Vision Pro 等新产品外,还展示了其在机器学习领域的最新进展。不过IT之家注意到... 人工智能# 机器学习 2年前350
机器学习、深度学习、神经网络之间的区别 机器学习、深度学习和神经网络是您在人工智能领域会听到的一些最常见的技术术语。 如果您不专注于构建 AI 系统,可能会感到困惑,因为这些术语经常互换使用。 在本文中,我将介绍机器学习、深度学习和神经网络... 人工智能# 机器学习 2年前330
用Python监测MLOps管道中的模型性能 点击参加51CTO网站内容调查问卷 译者 | 布加迪 审校 | 重楼 机器学习模型只有在生产环境中用于解决业务问题时才有帮助。然而,业务问题和机器学习模型在不断发展变化。这就要求我们维护机器学习,以便... 人工智能# 机器学习 2年前270
机器学习如何影响未来就业市场 机器学习正在改变各行各业,尤其是就业和就业市场,提高从初级职位到顶级职位的效率。这种先进的工具实现了自动化、智能决策,简化了工作流程,并从根本上改变了我们定义和执行工作的方式。机器学习对我们专业领域的... 人工智能# 机器学习 2年前80
探索量子机器学习的未来:综合指南 量子机器学习是量子计算和人工智能交叉领域中一个快速发展的领域,有望彻底改变我们处理和分析数据的方式。随着世界越来越多地成为数据驱动,对更高效、更强大的计算系统的需求从未如此强烈。进入量子机器学习,其利... 人工智能# 机器学习 2年前260
2023年机器学习的十大概念和技术 本文罗列了2023年机器学习的十大概念和技术。 2023年机器学习的十大概念和技术是一个教计算机从数据中学习的过程,无需明确的编程。机器学习是一个不断发展的学科,一直在创造新的想法和技术。为了保持领先... 人工智能# 机器学习 2年前180
如何用机器学习革新物流和供应链管理 机器学习可以带来巨大的好处,包括实时需求预测、可持续物流和高级预测分析。物流和供应链行业是一个复杂的网络,由各种相互连接的组件组成,需要精心规划、执行和优化,以确保平稳高效的运营。该行业在不断发展,随... 人工智能# 机器学习 2年前200
机器学习都能做些什么呢?你知道吗? 机器学习的两大应用场景—回归与分类 回归(regression)和分类(classification)是两种最常见的机器学习问题类型,如下图所示。 回归问题通常用来预测一个值,其标签的值是连续的。例如... 人工智能# 机器学习 2年前90
蔚来汽车深度学习算法实践 一、NIO Power 业务背景 1、蔚来汽车能源服务体系 NIO Power 业务团队的目标是构建全球创新的智能能源服务体系,基于移动互联网的加电解决方案,拥有广泛布局的充电换电设施网络,依托蔚来云... 人工智能# 机器学习 2年前320
从决策树到Transformer——餐厅评论情感分析模型比较 译者 | 朱先忠 审校 | 孙淑娟 本文将展示各种流行机器学习模型和嵌入技术对马其顿餐厅评论情感分析的有效性,探索并比较几种经典的机器学习模型以及包括神经网络和Transformers在内的现代深... 人工智能# 机器学习 2年前470
利用模型性能管理(MPM)解决机器学习模型监控挑战 译者 | 李睿 审校 | 孙淑娟 在过去几年,世界的数字化给组织和企业带来了独特的机遇和挑战。虽然数据的蓬勃发展为提高决策准确度提供了更多的机会,但现在分析和利用这些信息更加耗时和昂贵。因此,各种规... 人工智能# 机器学习 2年前960
机器学习正在赋能制药行业 机器学习一直在各个行业掀起波澜,包括制药行业。 通过利用先进的算法和大量数据,机器学习正在彻底改变药物的开发、制造和分销方式。在本文中,我们将探讨机器学习如何为制药行业赋能。 药物发现与开发 机器学习... 人工智能# 机器学习 2年前370
机器学习中入门级必学的算法有哪些? K-近邻算法 什么是k-近邻算法? 就是根据你的邻居推断出你的类别 概念: K Nearest Neighbor算法又叫KNN算法,这个算法是机器学习里面一个比较经典的算法, 总体来说KNN算法是相对... 人工智能# 机器学习 2年前260
为解决机器学习碎片化问题,阿里、苹果、谷歌等 12 家巨头推出 OpenXLA 3 月 12 日消息,据谷歌官博消息,机器学习 ML 开发和部署如今受到了分散和孤立的基础设施的影响,这些基础设施可能因框架、硬件和用例而异。这种碎片化限制了开发者的速度,并对模型的可移植性、效率和生... 人工智能# 机器学习 2年前200
机器学习如何应对气候变化 近年来,人工智能(AI)因其彻底改变从医疗保健到金融等行业的潜力而成为头条新闻。但人工智能被证明特别有前途的一个领域是应对气候变化。机器学习是人工智能的一个子集,正被用于解决当今面临的一些最紧迫的环境... 人工智能# 机器学习 2年前460
一文读懂什么是机器学习 世界充满了数据——由人和计算机生成的图像、视频、电子表格、音频和文本充斥着互联网,将我们淹没在信息的海洋中。 传统上,人类分析数据以做出更明智的决策,并设法调整系统以控制数据模式的变化。然而,随着传入... 人工智能# 机器学习 2年前440
量子机器学习:新手指南 译者 | 布加迪 审校 | 孙淑娟 简介 欢迎来到量子机器学习世界!本教程将通过一个使用示例数据集的入门级项目,提供附有代码的分步走指导。本教程结束时,您将对如何使用量子计算机来执行机器学习任务有一... 人工智能# 机器学习 2年前170
机器学习与微分方程的浅析 大家都已经使用机器学习了,尤其是基于神经网络的深度学习,chatGPT甚嚣尘上,还需要深入理解微分方程么?不论答案是啥,都会涉及到二者的对比,那么,机器学习与微分方程的区别又是什么呢? 从爱情模型的微... 人工智能# 机器学习 2年前90
结合基于规则和机器学习的方法构建强大的混合系统 经过这些年的发展,我们都确信ML即使不能表现得更好,至少也可以在几乎所有地方与前ML时代的解决方案相匹配。比如说一些规则约束,我们都会想到能否把它们替换为基于树的ml模型。但是世界并不总是黑白分明的... 人工智能# 机器学习 2年前450
集成时间序列模型提高预测精度 使用Catboost从RNN、ARIMA和Prophet模型中提取信号进行预测。 集成各种弱学习器可以提高预测精度,但是如果我们的模型已经很强大了,集成学习往往也能够起到锦上添花的作用。流行的机器学习... 人工智能# 机器学习 2年前440
机器学习如何使农业更具可持续性 在气候迅速变化的时代,实现农业可持续性对于确保地球的健康和福祉至关重要。 由于资源有限,人口不断增加,传统的耕作方式已无法支持可持续的粮食系统。 好在,当前机器学习的技术进步为实现更可持续的农业实践提... 人工智能# 机器学习 2年前370
稀疏特征和密集特征 在机器学习中,特征是指对象、人或现象的可测量和可量化的属性或特征。特征可以大致分为两类:稀疏特征和密集特征。 稀疏特征 稀疏特征是那些在数据集中不连续出现的特征,并且大多数值为零。稀疏特征的示例包括文... 人工智能# 机器学习 2年前2130
生成式人工智能在物联网中的地位如何? 近期,主流媒体都十分担心Alexa、Siri和Google的数字助理。这是因为,到目前为止,这些产品还没有使用生成式人工智能。生成式人工智能,是一组机器学习模型,经过训练可以根据提示猜测下一组单词或正... 人工智能# 机器学习 2年前240
科学家利用机器学习,用于区分可降解塑料和传统塑料 食品包装袋、咖啡杯、塑料袋……,塑料在我们的日常生活中随处可见。近年来随着国家政策的引导和居民环保意识的提高,越来越多的人开始使用可降解的塑料制品。 只是这些可降解的塑料制品和传统塑料之间,在外观上很... 人工智能# 机器学习 2年前230
通过使用因果机器学习做出有效的可操作决策以优化业务KPI 译者 | 李睿 审校 | 孙淑娟 在不同的场景中,常用的机器学习建模技术可能会误解数据中的真实关系。因此在这里试图改变这种范式,以基于估计因果关系和衡量目标关键绩效指标(KPI)结果的治疗效果... 人工智能# 机器学习 2年前390
AI开发大一统:谷歌OpenXLA开源,整合所有框架和AI芯片 在去年 10 月的 Google Cloud Next 2022 活动中,OpenXLA 项目正式浮出水面,谷歌与包括阿里巴巴、AMD、Arm、亚马逊、英特尔、英伟达等科技公司推动的开源 AI 框架合... 人工智能# 机器学习 2年前520
如何处理生产环境中的数据和机器学习偏误? 译者 | 布加迪 审校 | 重楼 您是否需要确定自己的数据集存在性别或种族方面的偏误?是否需要确保所使用的机器学习模型没有偏误,即使数据有偏误?如果您对上述问题的回答是肯定的,那么这篇文章就适合您阅读... 人工智能# 机器学习 2年前260
人工智能在异常检测中的作用 人工智能(AI)近年来取得了重大进展,彻底改变了各个行业,也改变了我们的生活和工作方式。人工智能产生深远影响的一个领域是异常检测,这是网络安全、金融、医疗保健和制造等许多领域的关键流程。异常检测涉及识... 人工智能# 机器学习 2年前170
如何应用机器学习增强员工效率? 通过利用机器学习的力量,组织可以简化流程,让员工能够将时间重新集中在真正重要的工作上。 普通员工每天花大约四个小时在管理任务上,例如回复电子邮件、安排会议和管理工作量。 虽然这些任务是必要的,但可能很... 人工智能# 机器学习 2年前150
和TensorFlow一样,英伟达CUDA的垄断格局将被打破? 十年来,机器学习软件开发的格局发生了重大变化。许多框架如雨后春笋般涌现,但大多数都严重依赖于英伟达的 CUDA,并在英伟达的 GPU 上才能获得最佳的性能。然而,随着 PyTorch 2.0 和 O... 人工智能# 机器学习 2年前300
机器学习在零售业中的十个关键应用 近年来,在封锁、宵禁、供应链中断和能源紧缩之间,零售商一定感觉很恐慌。但,幸运的是,零售业可以依靠全方位的技术创新来更好地应对这些困难时期的挑战。 这些技术中最有影响力的工具之一肯定是人工智能,包括其... 人工智能# 机器学习 2年前2540
超参数优化比较之网格搜索、随机搜索和贝叶斯优化 译者 | 朱先忠 审校 | 孙淑娟 简介 通常,在尝试改进机器学习模型时,人们首先想到的解决方案是添加更多的训练数据。额外的数据通常是有帮助(在某些情况下除外)的,但生成高质量的数据可能非常昂贵... 人工智能# 机器学习 2年前200
基于机器学习的电商数据挖掘 | 数据探索篇 本文转载自微信公众号「尤而小屋」,作者尤而小屋 。转载本文请联系尤而小屋公众号。 大家好,我是Peter~ 最近获取到了一份IC电子产品电商数据,后面会进行3个主题的数据分析与挖掘: 第一阶段:基于p... 人工智能# 机器学习 2年前140
优化机器学习部署:提示和技巧 机器学习模型仅在部署在生产环境中时才有效;这就是机器学习部署变得不可或缺的地方。 机器学习已成为许多行业不可或缺的一部分,从医疗保健到金融等等。它为我们提供了获得有意义的见解和做出更好决策所需的工具... 人工智能# 机器学习 2年前180
机器学习系统架构的十个要素 这是一个AI赋能的时代,而机器学习则是实现AI的一种重要技术手段。那么,是否存在一个通用的通用的机器学习系统架构呢? 在老码农的认知范围内,Anything is nothing,对系统架构而言尤其如... 人工智能# 机器学习 2年前170
涨知识!用逻辑规则进行机器学习 Skope-rules使用树模型生成规则候选项。首先建立一些决策树,并将从根节点到内部节点或叶子节点的路径视为规则候选项。然后通过一些预定义的标准(如精确度和召回率)对这些候选规则进行过滤。只有那些精... 人工智能# 机器学习 2年前240
少样本学习综述:技术、算法和模型 机器学习最近取得了很大的进展,但仍然有一个主要的挑战:需要大量的标记数据来训练模型。 有时这种数据在现实世界中是无法获得的。以医疗保健为例,我们可能没有足够的x光扫描来检查一种新的疾病。但是通过少样本... 人工智能# 机器学习 2年前210
基于因果森林算法的决策定位应用 译者 | 朱先忠 审校 | 孙淑娟 在我之前的博客中,我们已经了解了如何使用因果树来评估政策的异质处理效应。如果你还没有阅读过,我建议你在阅读本文前先读一遍,因为我们在本文中认为你已经了解... 人工智能# 机器学习 2年前90
盘点20多个强大且免费的数据源,任何人都能以此来构建AI 当我们谈论当今商业领域和社会中的人工智能时,我们其实指的是机器学习。机器学习是一种应用,通过使用算法(一组指令)变得越来越擅长执行某项特定任务,因为它接触了越来越多与这项任务相关的数据。 这些任务可以... 人工智能# 机器学习 2年前560
机器学习基础之数字上的距离:点在空间中的距离 本文转载自微信公众号「活在信息时代」,作者活在信息时代。转载本文请联系活在信息时代公众号。 在机器学习中,一个基础的概念就是如何判断两个样本之间的差异,从而能够评价两个样本之间的相似性和类别等信息... 人工智能# 机器学习 2年前190
如何使用机器学习来分析情感 我们使用了不同的机器学习算法进行情感分析,然后将各个算法的准确率结果进行比较,以确定哪一种算法最适合这个问题。 情感分析是自然语言处理(NLP)中的一个重要的内容。情感指的是我们对某一事件、物品、情况... 人工智能# 机器学习 2年前300
机器学习助力高质量软件工程 译者 | 朱先忠 审校 | 孙淑娟 引言 一般来说,软件测试往往是比较简单的:每个输入=>已知输出。然而,纵观整个软件测试的历史,会发现很多测试往往都停留在猜测水平上。也就是说,测试时由开发者构... 人工智能# 机器学习 2年前190
选择优秀机器学习模型的十步指南 机器学习可以用来解决广泛的问题。但是有很多多不同的模型可以选择,要知道哪一个适合是一个非常麻烦的事情。本文的总结将帮助你选择最适合需求的机器学习模型。 1、确定想要解决的问题 第一步是确定想要解决的问... 人工智能# 机器学习 2年前170
为深度学习选择最好的GPU 在进行机器学习项目时,特别是在处理深度学习和神经网络时,最好使用GPU而不是CPU来处理,因为在神经网络方面,即使是一个非常基本的GPU也会胜过CPU。 但是你应该买哪种GPU呢?本文将总结需要考虑的... 人工智能# 机器学习 2年前330
机器学习模型以出色的精度进行有机反应机理分类 化学反应的发现不仅受到获得实验数据的速度的影响,还受到化学家理解这些数据的难易程度的影响。揭示新的催化反应的机理基础是一个特别复杂的问题,通常需要计算和物理有机化学的专业知识。然而,研究催化反应很重要... 人工智能# 机器学习 2年前280
基于SARIMA、XGBoost和CNN-LSTM的时间序列预测对比 利用统计测试和机器学习分析和预测太阳能发电的性能测试和对比 本文将讨论通过使用假设测试、特征工程、时间序列建模方法等从数据集中获得有形价值的技术。我还将解决不同时间序列模型的数据泄漏和数据准备等问题... 人工智能# 机器学习 2年前150
年终盘点:2022年最炙手可热的十家数据科学和机器学习初创公司 随着企业要应对越来越多的数据(包括组织内部生成的和从外部来源收集的数据),找到有效的方法来分析和“操作”这些数据以获得竞争优势,变得越来越具有挑战性。 这也推动了数据科学和机器学习领域对新工具和新技术... 人工智能# 机器学习 2年前1780
机器学习评估指标的十个常见面试问题 评估指标是用于评估机器学习模型性能的定量指标。它们提供了一种系统和客观的方法来比较不同的模型并衡量它们在解决特定问题方面的成功程度。通过比较不同模型的结果并评估其性能可以对使用哪些模型、如何改进现有模... 人工智能# 机器学习 2年前890
如何使用 Docker 在 AWS Lambda 上部署机器学习模型 在本教程中,我们将引导您完成将 ML 模型打包为 Docker 容器并将其部署在无服务器计算服务 AWS Lambda 上的过程。 在本教程结束时,您将拥有一个可以通过 API 调用的工作 ML 模型... 人工智能# 机器学习 2年前200
图机器学习无处不在,用 Transformer 可缓解 GNN 限制 在我们今天的生活中,图的示例包括社交网络、例如Twitter、Mastodon、以及任何链接论文和作者的引文网络,分子,知识图、例如 UML 图、百科全书以及有超链接的网站,表示为句法树的句子以及任何... 人工智能# 机器学习 2年前100
从视频到音频:使用VIT进行音频分类 就机器学习而言,音频本身是一个有广泛应用的完整的领域,包括语音识别、音乐分类和声音事件检测等等。传统上音频分类一直使用谱图分析和隐马尔可夫模型等方法,这些方法已被证明是有效的,但也有其局限性。近期VI... 人工智能# 机器学习 2年前210
机器学习中实施随机森林算法的指南 随着机器学习模型在预测和分析数据方面变得越来越流行,随机森林算法的使用正在获得动力。随机森林是一种监督学习算法,用于机器学习领域的回归和分类任务。它的工作原理是在训练时构建大量决策树并输出类,即类的模... 人工智能# 机器学习 2年前350
使用PyTorch进行知识蒸馏的代码示例 随着机器学习模型的复杂性和能力不断增加。提高大型复杂模型在小数据集性能的一种有效技术是知识蒸馏,它包括训练一个更小、更有效的模型来模仿一个更大的“教师”模型的行为。 在本文中,我们将探索知识蒸馏的概念... 人工智能# 机器学习 2年前330
CRPS:贝叶斯机器学习模型的评分函数 连续分级概率评分(Continuous Ranked Probability Score, CRPS)或“连续概率排位分数”是一个函数或统计量,可以将分布预测与真实值进行比较。 机器学习工作流程的一个... 人工智能# 机器学习 2年前110
达摩院开源半监督学习框架Dash,刷新多项SOTA 一、研究背景 监督学习(Supervised Learning) 我们知道模型训练的目的其实是学习一个预测函数,在数学上,这可以刻画成一个学习从数据 (X) 到标注 (y) 的映射函数。监督学习就是... 人工智能# 机器学习 2年前80
机器学习如何赋能自动驾驶汽车 配备机器学习算法的自动驾驶汽车可以做出更好的决策、识别和分类物体,以及解释情况。 在世界的日常运作中,人类已经取得了长足的进步,技术的融合只会越来越紧密。人工智能及其子类机器学习在整个创新时代引起了巨... 人工智能# 机器学习 2年前90
一日一卡挑战:RTX2080Ti搞定大模型训练,算力节省136倍,学界欢呼 在一块消费级 GPU 上只用一天时间训练,可以得到什么样的 BERT 模型? 最近一段时间,语言模型再次带火了 AI 领域。预训练语言模型的无监督训练属性使其可以在海量样本基础上进行训练,并获得大量语... 人工智能# 机器学习 2年前280
机器学习决策树实战演练 译者 | 朱先忠 审校 | 孙淑娟 机器学习中的决策树 现代机器学习算法正在改变我们的日常生活。例如,像BERT这样的大型语言模型正在为谷歌搜索提供支持,GPT-3正在为许多高级语言应用程序提供支持... 人工智能# 机器学习 2年前330
浅谈图嵌入算法 Part 01 ● 什么是图嵌入 ● 图嵌入是将图结构数据映射为低维稠密向量的过程,同时使得原图中拓扑结构相似或属性接近的节点在向量空间上的位置也接近,能够很好地解决图结构数据难以高效输入机器学习... 人工智能# 机器学习 2年前270
家中狗子都在想些啥,科学家们利用机器学习搞清楚了 铲屎官们有没有想过,每天向你撒娇、求投喂的狗狗,它脑海里究竟在想什么? 为什么有时候投入大把精力养熟的狗子,转头就可以扑向别人的怀里? 其实,狗狗这么做并不故意是要气你—— 一项来自埃默里大学的实验表... 人工智能# 机器学习 2年前110
2022出圈的ML研究:爆火的Stable Diffusion、通才智能体Gato,LeCun转推 2022 年即将步入尾声。在这一年里,机器学习领域涌现出了大量有价值的论文,对机器学习社区产生了深远的影响。 今日,ML & NLP 研究者、Meta AI 技术产品营销经理、DAIR.AI ... 人工智能# 机器学习 2年前150
使用CLIP构建视频搜索引擎 CLIP(Contrastive Language-Image Pre-training)是一种机器学习技术,它可以准确理解和分类图像和自然语言文本,这对图像和语言处理具有深远的影响,并且已经被用作流... 人工智能# 机器学习 2年前450
常见的降维技术比较:能否在不丢失信息的情况下降低数据维度 本文将比较各种降维技术在机器学习任务中对表格数据的有效性。我们将降维方法应用于数据集,并通过回归和分类分析评估其有效性。我们将降维方法应用于从与不同领域相关的 UCI 中获取的各种数据集。总共选择了 ... 人工智能# 机器学习 2年前180
清华大学发布首个课程学习开源库CurML 在机器学习的发展过程中,人类的学习方式常常会对各种算法的设计产生启发。而作为人类学习的一个重要范式,通过课程进行学习,已经被借鉴到机器学习中形成了名为课程学习(Curriculum Learning... 人工智能# 机器学习 2年前440
使用马尔可夫链构建文本生成器 本文中将介绍一个流行的机器学习项目——文本生成器,你将了解如何构建文本生成器,并了解如何实现马尔可夫链以实现更快的预测模型。 文本生成器简介 文本生成在各个行业都很受欢迎,特别是在移动、应用和数据科学... 人工智能# 机器学习 2年前410
研究表明强化学习模型容易受到成员推理攻击 译者 | 李睿 审校 | 孙淑娟 随着机器学习成为人们每天都在使用的很多应用程序的一部分,人们越来越关注如何识别和解决机器学习模型的安全和隐私方面的威胁。 然而,不同机器学习范式面临的安全威胁... 人工智能# 机器学习 2年前200
十个用于 AutoML 的 GitHub 存储库 人工智能和机器学习的突破是过去二十年中最激动人心的两个话题。机器学习和数据科学工程师需要广泛的研究和努力工作才能有效地理解和运行他们的模型。 虽然它们可能因人而异,但传统的机器学习步骤包括: 数据采集... 人工智能# 机器学习 2年前270
使用scikit-learn为PyTorch模型进行超参数网格搜索 scikit-learn是Python中最好的机器学习库,而PyTorch又为我们构建模型提供了方便的操作,能否将它们的优点整合起来呢?在本文中,我们将介绍如何使用 scikit-learn中的网格搜... 人工智能# 机器学习 2年前160
业界首个适用于固体系统的神经网络波函数,登上Nature子刊 机器学习能够处理海量数据,解决复杂场景下的科学难题,带领科学探索抵达过去无法触及的新领域。比如 DeepMind 用人工智能软件 AlphaFold 对科学界已知的几乎所有蛋白质结构进行了高度准确的... 人工智能# 机器学习 2年前70
还不会机器学习模型部署?15 张图带你走进TensorFlow 部署框架! 开篇 前几日与一位从事开发3年的朋友小李聊天,得知他所在的企业正在进行机器学习相关的项目。最近,他接到了一个任务,就是将训练好的机器学习模型进行部署。这可愁坏了小李,他接触机器学习开发差不多有小半年了... 人工智能# 机器学习 2年前250
度小满自动机器学习平台实践 随着 AI 技术的发展,不同业务涉及的 AI 技术越来越多样,同时 AI 模型参数量逐年爆发式增长,如何克服 AI 算法落地面临的开发成本高、对人工依赖强、算法不稳定及落地周期长等问题,成为困扰人工智... 人工智能# 机器学习 2年前370
为机器学习模型设置最佳阈值:0.5是二元分类的最佳阈值吗 对于二元分类,分类器输出一个实值分数,然后通过对该值进行阈值的区分产生二元的相应。例如,逻辑回归输出一个概率(一个介于0.0和1.0之间的值);得分等于或高于0.5的观察结果产生正输出(许多其他模型默... 人工智能# 机器学习 2年前120
聊一聊机器学习生命周期的步骤 在本文中,读者将了解机器学习,包括机器学习的背景信息和机器学习生命周期的七个步骤。 如果您在过去几年一直在考虑机器学习,那么您不是唯一的人。这是一项大业务,可以对公司的绩效产生重大影响,提供急需的竞争... 人工智能# 机器学习 2年前140
时间序列机器学习数据集的非常规拆分技术 确保机器学习模型在未知环境中泛化的一种尝试是拆分数据。这可以通过多种方式实现,从3-way(训练、测试、评估)拆分到交叉验证的k拆分。其基本原理是,通过在数据子集上训练机器学习模型,并在未知数据上进行... 人工智能# 机器学习 2年前1730
2023 年值得关注的十机器学习趋势 机器学习创建的算法支持机器更好地理解人工智能与员工利益和业务目标保持一致。根据预测分析,到 2024 年机器学习将变得相当普遍。 以下是关于 2022 年出现的机器学习趋势的指南: 1.机器学习操作化... 人工智能# 机器学习 2年前180
数学优化和机器学习结合使用的四种方法简介 数学优化与机器学习 数学优化(或数学规划)是一个强大的决策工具。通过制定目标并指定约束条件和变量,数学优化可以帮助在当前现实环境下做出最佳决策。它已经在航空、物流、电力和金融等许多不同行业证明了其价值... 人工智能# 机器学习 2年前200
机器学习之模型管理:集成建模 译者 | 崔皓 审校 | 孙淑娟 开篇 机器学习被企业应用到不同的业务场景解决不同的业务问题,随着机器学习的广泛应用也让组织在选择学习方法时不堪重负。 很多组织在机器学习的应用中使用了高级和经典的... 人工智能# 机器学习 2年前140
IEEE Fellow 李学龙:多模态认知计算是实现通用人工智能的关键 在如今数据驱动的人工智能研究中,单一模态数据所提供的信息已经不能满足提升机器认知能力的需求。与人类利用视觉、听觉、嗅觉、触觉等多种感官信息来感知世界类似,机器也需要模拟人类联觉来提升认知水平。 同时... 人工智能# 机器学习 2年前90
为什么机器学习中的数据要用向量/矩阵来表示? 在数据科学和机器学习中,我们经常将数据表示为向量和矩阵。在数学和物理中,向量被定义大小和方向的量(例如,距离向量)。然而,通常我们处理的数据不一定会遵循向量的定义,但但我们仍然用向量来表示数据。例如... 人工智能# 机器学习 2年前310
eBay使用机器学习完善促销列表 译者 | 布加迪 审校 | 孙淑娟 在线市场eBay在其机器学习模型中加入了额外的购买信号,比如“添加到关注列表”、“出价”和“添加到购物车”,根据搜索的初始商品提高所推荐的广告列表具有的相关性。C... 人工智能# 机器学习 2年前120
机器学习模型和高斯过程的不确定性 介绍 让我们以一个例子来说明我们所面临的问题。想象一下,我们训练一个神经网络模型来预测包含汽车图像的概率。当我们使用这些概率来对有汽车的图像进行分类时,我们的模型有很好的准确性。在某些时候,我们给神经... 人工智能# 机器学习 2年前350
新手在机器学习中常见的五大问题 处理缺失值 在数据预处理中,关键步骤是处理缺失的数据,因为机器学习模型不会接受NaN值作为它们的输入。有很多种方法可以填充这些NaN值,但我们首先需要理解缺失值的重要性。 很简单的一种方法是从机器学习... 人工智能# 机器学习 2年前100
负责任的机器学习--“玻璃盒”方法 译者 | 崔皓 审校 | 孙淑娟 开篇 机器学习并不是一项深奥的技术。正如在复杂的深度神经网络中多参数和超参数的方法只是认知计算的一种表现形式,看上去也没有那么深奥。 还存在其他一些机器学习的种类... 人工智能# 机器学习 2年前100
人工智能公平技术对于挽救生命具有重大意义 弗吉尼亚理工大学计算机科学教授Daphne Yao希望提高机器学习模型在医疗应用中的预测精度。不准确的预测可能会导致危及生命的后果。这些预测误差可能会导致错误计算病人在急诊室就诊时死亡或癌症存活的可能... 人工智能# 机器学习 2年前90
图嵌入概述:节点、边和图嵌入方法及Python实现 近年来基于图的机器学习有了很大的发展。基于图的方法在数据科学中的许多常见问题中都有应用,例如链接预测、社群发现、节点分类等。根据如何组织问题和所拥有的数据,有许多解决问题的方法。本文将提供一个基于图的... 人工智能# 机器学习 2年前320
什么是文本分类? 译者 | 李睿 审校 | 孙淑娟 什么是文本分类? 文本分类是将文本分类为一个或多个不同类别以组织、构造和过滤成任何参数的过程。例如,文本分类用于法律文件、医学研究和文件中,或者简单地用于产品评... 人工智能# 机器学习 2年前130
机器学习入门必备:如何用Python从头实现感知器算法 在本教程中,你将了解到如何利用 Python 从头开始实现感知器算法。 在完成本教程后,你将学会: 如何训练感知器的网络权重 如何利用感知器做出预测 如何对于现实世界的分类问题实现感知器算法 让我们开... 人工智能# 机器学习 2年前360
机器学习的三大“疑难杂症”,因果学习是突破口 本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。 重庆和许多西部城市一样,常常被诟病为“互联网荒漠”,但它却有着很好的物联网土壤。 有数据显示,重庆有着近2000家物联网相... 人工智能# 机器学习 2年前230
机器学习11种特征选择策略总结! 太多的特征会增加模型的复杂性和过拟合,而太少的特征会导致模型的拟合不足。将模型优化为足够复杂以使其性能可推广,但又足够简单易于训练、维护和解释是特征选择的主要工作。 “特征选择”意味着可以保留一些特征... 人工智能# 机器学习 2年前270