iPhone两秒出图,目前已知的最快移动端Stable Diffusion模型来了 Stable Diffusion (SD)是当前最热门的文本到图像(text to image)生成扩散模型。尽管其强大的图像生成能力令人震撼,一个明显的不足是需要的计算资源巨大,推理速度很慢:以 S... 人工智能# 模型 3年前140
650亿参数,8块GPU就能全参数微调:邱锡鹏团队把大模型门槛打下来了 在大模型方向上,科技巨头在训更大的模型,学界则在想办法搞优化。最近,优化算力的方法又上升到了新的高度。 大型语言模型(LLM)彻底改变了自然语言处理(NLP)领域,展示了涌现、顿悟等非凡能力。然而,若... 人工智能# 模型 3年前140
如何应对生成式大模型「双刃剑」?之江实验室发布《生成式大模型安全与隐私白皮书》 当前,生成式大模型已经为学术研究甚至是社会生活带来了深刻的变革,以 ChatGPT 为代表,生成式大模型的能力已经显示了迈向通用人工智能的可能性。但同时,研究者们也开始意识到 ChatGPT 等生成式... 人工智能# 模型 3年前140
清华系千亿基座对话模型ChatGLM启动内测,开源单卡版模型 ChatGPT 的发布,搅动了整个 AI 领域,各大科技公司、创业公司以及高校团队都在跟进。近段时间,机器之心报道了多家创业公司、高校团队的研究成果。 昨日,又一国产 AI 对话大模型重磅登场:由清华... 人工智能# 模型 3年前140
细数NLP与CV的融合创新:盘点多模态深度学习这几年 近年来,NLP 和 CV 领域在方法上突破不断。不只是单模态模型有所进展,而大规模多模态方法也已经成为非常热门的研究领域。 论文地址:https://arxiv.org/pdf/2301.04856v... 人工智能# 模型 3年前140
开源!港中文、MIT、复旦提出首个RNA基石模型 不同于蛋白质领域,RNA 领域的研究往往缺少充足的标注数据,比如 3D 数据只有 1000 多个 RNA。这极大限制了机器学习方法在 RNA 结构功能预测任务中的开发。 为了弥补标注数据的不足,本文展... 人工智能# 模型 3年前140
聊聊客户档案模型的设计与管理 围绕客户管理通常分为售前、售中、售后、三个核心阶段,即营销、销售、服务三个核心流程与策略,在之前的文章中有聊过CDP系统的设计,本篇从客户档案模型来看看设计上的细节;,首先说明在客户档案管理中的几个常... 网站建设# cdp# 客户# 客户档案 5年前140
「ChatGPT幻觉」变废为宝!灵感生成器DreamGPT开源:见识一下真正的脑洞大开 ChatGPT最为人诟病的缺陷就是「胡编乱造」了,可以一本正经地讲一段林黛玉倒拔垂杨柳的故事。 对于真正想了解「林黛玉」或「倒拔垂杨柳」的人来说,这段回答可以说是灾难级误导了,但对于专注于「虚构」和... 人工智能# 模型 3年前130
单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖 本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。 就在刚刚,UC伯克利博士、新加坡国立大学校长青年教授尤洋发布最新消息—— 斩获AAAI 2023杰出论文奖(Disting... 人工智能# 模型 3年前130
单个GPU,只花一天时间,能把BERT训练成什么样 本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。 单个GPU,只花一天时间,能把BERT训练成什么样? 现在,终于有研究人员做这件事了,在有限的计算条件之下看看语言模型的真... 人工智能# 模型 3年前130
Yann LeCun:大模型方向错了,智力无法接近人类 「语言只承载了所有人类知识的一小部分;大部分人类知识、所有动物知识都是非语言的;因此,大语言模型是无法接近人类水平智能的,」这是图灵奖得主 Yann LeCun 对于人工智能前景的最新思考。 昨天,他... 人工智能# 模型 3年前130
权重值:搜索引擎排名的关键因素 权重值是衡量某个因素或变量在整体中所占重要性的一个数值指标。在不同的领域和情境中,权重值的具体含义和计算方式可能有所不同。在统计学中,权重值通常用来表示数据点在总体中的相对重要性,它影响着数据的加权平... 系统教程# 因素# 数据# 权重 1年前0120
万字长文,带你搞懂 Kubernetes 网络模型 Kubernetes 是为运行分布式集群而建立的,分布式系统的本质使得网络成为 Kubernetes 的核心和必要组成部分,了解 Kubernetes 网络模型可以使你能够正确运行、监控和排查应用程序... 系统教程# kubernetes# 技术# 指南 2年前120
精通ChatGPT等大模型,掌握最前沿技术,这有份绝佳资源 最近几个月,要问 AI 界最出圈的模型有哪些,首当其冲应该是 OpenAI 相继发布的 ChatGPT、GPT-4 等模型,这些智能模型极大地改变了人类思考和处理问题的方式,进而可能重塑当今世界。 但... 人工智能# 模型 3年前120
LeCun转赞:在苹果M1/M2芯片上跑LLaMA!130亿参数模型仅需4GB内存 前不久,Meta前脚发布完开源大语言模型LLaMA,后脚就被网友放出了无门槛下载链接,「惨遭」开放。 消息一出,圈内瞬间就热闹了起来,大家纷纷开始下载测试。 但那些手头没有顶级显卡的朋友们,就只能望模... 人工智能# 模型 3年前120
Meta「分割一切」超进化版来了!IDEA领衔国内顶尖团队打造:检测、分割、生成一切,狂揽2k星 Meta的「分割一切」模型横空出世后,已经让圈内人惊呼CV不存在了。 就在SAM发布后一天,国内团队在此基础上搞出了一个进化版本「Grounded-SAM」。 注:项目的logo是团队用Midjour... 人工智能# 模型 3年前110
首个在ImageNet上精度超过80%的二值神经网络BNext问世,-1与+1的五年辛路历程 两年前,当 MeliusNet 问世时,机器之心曾发表过一篇技术文章《第一次胜过 MobileNet 的二值神经网络,-1 与 + 1 的三年艰苦跋涉》,回顾了 BNN 的发展历程。彼时,依... 人工智能# 模型 3年前110
今晚,为梅西和莫德里奇熬夜!这个CV模型,让你猜球必赢 前天,C罗的球迷们伤心惨了。 12月11日的卡塔尔世界杯上,葡萄牙不敌摩洛哥止步八强,C罗的世界杯之旅,就这样画上了遗憾的句号。 #C罗说梦想结束了#的这个热搜下,集结了不知多少心碎的球迷。 葡萄牙对... 人工智能# 模型 3年前100
解锁CNN和Transformer正确结合方法,字节跳动提出有效的下一代视觉Transformer 由于复杂的注意力机制和模型设计,大多数现有的视觉 Transformer(ViT)在现实的工业部署场景中不能像卷积神经网络(CNN)那样高效地执行。这就带来了一个问题:视觉神经网络能否像 CNN 一样... 人工智能# 模型 3年前100
模块化大模型来了!IBM公开WastonX核心架构技术细节 大型语言模型(LLMs)的性能非常强大,但是现有的模型训练和部署成本都很高。而且在不忘记先前知识的前提,扩展它们去学习新的知识也很困难。也很难针对特定的任务去提取出轻量化的模型。 最近,来自MIT-I... 人工智能# 模型 3年前90
全方位分析大模型参数高效微调,清华研究登Nature子刊 近年来,清华大学计算机系孙茂松团队深入探索语言大模型参数高效微调方法的机理与特性,与校内其他相关团队合作完成的研究成果 “面向大规模预训练语言模型的参数高效微调”(Parameter-efficien... 人工智能# 模型 3年前90
100万亿参数的GPT 4 刷屏AI社区,大概率是假消息 今天,你的朋友圈一定有这样一则重磅消息: 「GPT 3 有 1750 亿参数,而接下来的 GPT4 的参数高达 100 万亿」。这样一个「大新闻」引爆了 AI 社区,在推特、微信朋友圈引起了极大关注... 人工智能# 模型 3年前90