超越GPT 3.5的小模型来了!

去年年底,OpenAI 向公众推出了 ChatGPT,一经发布,这项技术立即将 AI 驱动的聊天机器人推向了主流话语的中心,众多研究者并就其如何改变商业、教育等展开了一轮又一轮辩论。 随后,科技巨头们...
3年前
410

如何在GPU资源受限情况下微调超大模型

提问:模型大小超过GPU 容量怎么办? 本文的灵感来自于Yandex数据分析学院教授的“高效深度学习系统”课程。 预备知识:假设读者已经了解神经网络的前传递和后向传递的工作原理,这对理解本文内容至关...
3年前
560

如何将一个算法模型转换成端智能模型?

在开始端智能技术工程实践的介绍前,有一个无法绕过的问题:端上的计算能力到底如何?虽然我们对神经网络运算加速有所耳闻,也知道不同的移动设备有着不同的加速方案,但没有一个定量的分析很难让我们有一个清晰客观...
3年前
280

如何应用数据模型?

​​​​一 前言 Vmo 是我在 18 年发布的一个工具库,用于快速创建数据模型,当时我写了一篇文章《Vmo 前端数据模型设计》得到过一段时间的关注,当时我从事三维装修相关的项目。在图形学的背景基础...
3年前
570

预训练、微调和上下文学习

最近语言模型在自然语言理解和生成方面取得了显著进展。这些模型通过预训练、微调和上下文学习的组合来学习。在本文中将深入研究这三种主要方法,了解它们之间的差异,并探讨它们如何有助于语言模型的学习过程...
3年前
490

Python高级架构模式的整理

,1、残差连接是目前常用的组件,解决了大规模深度学习模型梯度消失和瓶颈问题。,通常,在10层以上的模型中追加残差连接可能有帮助。,2、标准化用于使模型看到的不同样本更相似,有助于模型的优化和泛化。,以...
4年前
590

权限系统就该这么设计,yyds

这篇文章就来解答介绍一下权限系统的设计以及主流的五种权限模型。,权限管控可以通俗的理解为权力限制,即不同的人由于拥有不同权力,他所看到的、能使用的可能不一样。对应到一个应用系统,其实就是一个用户可能拥...
4年前
380

一文读懂“语言模型”

自然语言处理(NLP)近年来发生了革命性的变化,特别预训练语言模型的开发和使用,在许多应用方面都取得了显著的成绩。预训练语言模型有两个主要优点:一个是可以显著提高许多 NLP 任务的准确性。例如,可以...
4年前
440

python超参数如何优化

,1、手动调参,但这种方法依赖于大量的经验,而且比较费时。,许多情况下,工程师依靠试错法手工调整超参数进行优化,有经验的工程师可以在很大程度上判断如何设置超参数,从而提高模型的准确性。,2、网格化寻优...
4年前
470

学会洋葱架构,落地DDD得心应手

领域是一个知识的范畴。它指的是我们的软件所要模拟的业务知识。领域驱动设计的中心是领域模型,它对一个领域的流程和规则有着深刻的理解。洋葱架构实现了这一概念,并极大地改善了代码的品质,降低了复杂性,并且支...
4年前
400

python模型集成是什么

,说明,1、模型集成是指将一系列不同模型的预测结果集成在一起,从而获得更好的预测结果。,2、对于模型集成来说,模型的多样性非常重要。Diversityisstrength.用于集成的模型应尽可能好,同...
4年前
270

图像数据的特征工程

一提到特征工程,我们立即想到是表格数据。但是我们也可以得到图像数据的特征,提取图像中最重要的方面。这样做可以更容易地找到数据和目标变量之间的映射。,这样可以使用更少的数据和训练更小的模型。更小的模型可...
4年前
580

二十分钟了解K8S网络模型原理

​对于好多刚接触K8S,甚至是接触K8S很长时间的同学,K8S网络模型可以说是个很神秘的东西。那么对于这部分同学,恭喜你发现了本文,只要你花二十分钟的时间,就保证你能轻松掌握K8S网络模型原理。,首先...
4年前
510

如何在DDD中建立领域模型

作者 | TWInsights,在前文《​​当我们谈论DDD时我们在谈论什么​​》中我们讨论了DDD的战略设计和战术设计。在本文中我们将继续探讨领域模型。,,在实际项目中,模型设计者往往过早陷入具体构...
4年前
590