基于任何数据集创建LLM(Large Language Models)机器人 今天偶然翻到一个仓库 Embedchain,觉得很实用,分享给大家。仓库地址如下: https://github.com/embedchain/embedchain 它是基于 OpenAI 的,但是你... 人工智能# 数据集 2年前200
想学习人工智能,这个的数据集必须掌握,MNIST入门与实战 学习人工智能少不了需要一些数据集,比如进行鉴黄的人工智能少不了一些类似的图片。进行语音识别的人工智能,语料库是少不了的。对于初学人工智能的同学常常为数据集而发愁。今天我们就介绍一个非常简单,但很有用的... 人工智能# 数据集 2年前380
世界首款真开源类ChatGPT大模型Dolly 2.0,可随意修改商用 众所周知,在 ChatGPT 的问题上 OpenAI 并不 Open,从 Meta 那里开源的羊驼系列模型也因为数据集等问题「仅限于学术研究类应用」,在人们还在因为寻找绕过限制方法的时候,主打 100... 人工智能# 数据集 2年前250
使用手工特征提升模型性能 通过对原始数据进行手工的特征工程,我们可以将模型的准确性和性能提升到新的水平,为更精确的预测和更明智的业务决策铺平道路, 可以以前所未有的方式优化模型并提升业务能力。 原始数据就像一个没有图片的拼图游... 人工智能# 数据集 2年前230
280万条多模态指令-响应对,八种语言通用,首个涵盖视频内容的指令数据集MIMIC-IT来了 近段时间来,AI 对话助手在语言任务上取得了不小的进展。这种显著的进步不只是基于 LLM 强大的泛化能力,还应该归功于指令调优。这涉及到在一系列通过多样化和高质量指令的任务上对 LLM 进行微调。 借... 人工智能# 数据集 2年前490
在重复和挑战性天气条件下的数据集和驾驶感知 arXiv论文“Ithaca365: Dataset and Driving Perception under Repeated and Challenging Weather Conditions... 人工智能# 数据集 2年前240
ChiQA-一个基于20万个真实用户问题的图片问答数据集 近年来,随着问答技术和多模态理解技术的蓬勃发展,视觉问答任务(Visual Question Answering)变得越来越受关注。诸如 VQA、CLEVER、Visual-7W 等大规模视觉问答数... 人工智能# 数据集 2年前390
清华、剑桥、UIC联合推出首个中文事实核查数据集:基于证据、涵盖医疗社会等多个领域 论文地址:https://arxiv.org/pdf/2206.11863.pdf 数据集CHEF Dataset链接:https://github.com/THU-BPM/CHEF 1. 介绍 我们... 人工智能# 数据集 2年前310