标签:数据
win11更新后要重新下东西吗
由于我们会在电脑里安装很多软件,所以担心更新系统后都没了,那么win11更新后要重新下东西吗,其实是不需要的,只要选择正常安装win11就可以了。,答:理论上...
win11退回win10会清除数据吗
win11现在也是面向大部分电脑都开放了,我们在升级win11过后数据会保持十天,如果在十天之内我们回退是不会损失原有的数据的,如果更新之后过了十天就只能提...
升级win11数据会不会清空详情
很多的小伙伴都担心自己的系统升级win11之后数据会不会被情况,所以今天就给你们带来了升级win11数据会不会清空详情,如果你还在疑惑不敢升级,下面就一起来...
最高年薪近56万!2023最新AIGC就业趋势报告出炉
不用赘述,大家都知道,最近半年ChatGPT是有多么火爆。 随着ChatGPT的全球爆火,AIGC也已成功从科技领域破圈,成为跨越所有圈层的全民话题。 AIGC对图文、...
给大语言模型“开个眼”,看图说话性能超CLIP!斯坦福等新方法无需多模态预训练
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。 不靠多模态数据,大语言模型也能看得懂图?! 话不多说,直接看效果。 就拿曾测试...
一句话搞定数据分析,浙大全新大模型数据助手,连搜集都省了
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。 处理数据,用这一个AI工具就够了! 依靠背后的大语言模型(LLM),只需要用一句话描...
BLIP-2、InstructBLIP稳居前三!十二大模型,十六份榜单,全面测评「多模态大语言模型」
多模态大语言模型(Multimodal Large Language Model,MLLM)依赖于LLM丰富的知识储备以及强大的推理和泛化能力来解决多模态问题,目前已经涌现出一些令人惊...
将入学考试题搬进中文大模型数据集,20477道题目,还带4个候选答案
随着中文大规模语言模型在自然语言理解与自然语言生成方面展现出强大的性能,现有针对特定自然语言处理任务的中文评测基准数据集已经不足以对中文大模型进行...
30万真实查询、200万互联网段落,中文段落排序基准数据集发布
段落排序是信息检索领域中十分重要且具有挑战性的话题,受到了学术界和工业界的广泛关注。段落排序模型的有效性能够提高搜索引擎用户的满意度并且对问答系统...
无需标注海量数据,目标检测新范式OVD让多模态AGI又前进一步
目标检测是计算机视觉中一个非常重要的基础任务,与常见的的图像分类 / 识别任务不同,目标检测需要模型在给出目标的类别之上,进一步给出目标的位置和大小信...
从ODS到ADS,详解数仓分层!
一、为什么要对数据仓库分层 只有数据模型将数据有序的组织和存储起来之后,大数据才能得到高性能、低成本、高效率、高质量的使用。 01 分层意义 1)清晰...
熔岩羊驼LLaVA来了:像GPT-4一样可以看图聊天,无需邀请码,在线可玩
GPT-4 的识图能力什么时候能上线呢?这个问题目前依然没有答案。 但研究社区已经等不及了,纷纷自己上手 DIY,其中最火的是一个名为 MiniGPT-4 的...
世另我?国外小伙用必应+ChatGPT复刻自己最好的朋友
在如今这个时代,微信等通讯软件已经成为了日常生活必不可少的组成要素。 而数据科学家伊兹-米勒(Izzy Miller)又进一步认为,群组聊天在当今社会是一件「...
一文读懂Tesla数据标注系统
Andrej Karpathy博士说,模型需要数据来驱动,模型决定上限,而数据帮助模型到达这个上限! 有的小伙伴可能会问,不就是标个数据么,有什么好讲的???找几...
实时数据推动人工智能“工厂”
这项研究将实时数据的使用与更高的收入增长和更高的开发人员生产力联系起来。 数据就是数据,但当它是实时数据时,它的价值就开始成倍增长。一项新的研究表...
人人PyTorch,上A100能夺冠:分析完去年200场数据竞赛,我悟了
2022 年是 AI 领域发展的重要一年,在数据竞赛领域也同样如此,所有平台的总奖金超过了 500 万美元。 近日,机器学习竞赛分析平台 ML Contests 对 2022 年的...
Gartner:数据分析助力构建业务价值新等式
数据分析能力已经越来越变成一种业务能力,所以2022年,Gartner针对数据分析趋势提出了“构建业务价值新等式”的理念。 何为“新等式”?Gartner高级研究总监孙...
北大GPT解题有数学老师内味了,用人话讲难题,从高中数学到高数都能搞定
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。 北大团队教会AI把人话当编程语言用。 这下大语言模型(LLM)不光能做对数学题,而且...
首次发现!数据异构影响联邦学习模型,关键在于表征维度坍缩
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。 随着深度学习大获成功,保护用户数据隐私变得越来越重要。 联邦学习(Federated Lear...
弥补斯坦福70亿参数「羊驼」短板,精通中文的大模型来了,已开源
距离 ChatGPT 的最初发布,过去差不多四个月的时间了。就在上星期 GPT-4 发布时,ChatGPT 第一时间上线了新版本。不过众所周知的一个秘密是,不管是 ChatGPT ...
威大华人团队全新多模态数据分析及生成方法JAMIE,大幅提升细胞类型、功能预测能力
近年来,随着单细胞技术的迅速发展,我们得以测量了单个细胞的各种特征从而获取单细胞多模态数据(比如scRNA-seq,scATAC-seq,Patch-seq)。 这些数据有助...
ChatGPT要把数据标注行业干掉了?比人便宜20倍,而且还更准
没想到,AI 进化之后淘汰掉的第一批人,就是帮 AI 训练的人。 很多 NLP 应用程序需要为各种任务手动进行大量数据注释,特别是训练分类器或评估无监督模型的...
超越SOTA 3.27%,上交大等提出自适应本地聚合新方法
本文介绍的是一篇收录于 AAAI 2023 的论文,论文由位于上海交通大学的上海市可扩展计算与系统重点实验室、贝尔法斯特女王大学的华扬老师和路易斯安那州立大学...
伯克利开源首个泊车场景下的高清数据集和预测模型,支持目标识别、轨迹预测
在自动驾驶技术不断迭代的当下,车辆的行为和轨迹预测对高效、安全驾驶有着极为重要的意义。动力学模型推演、可达性分析等传统的轨迹预测的方法虽然有着形式...
LSTM之父再次约战LeCun:你那5点「创新」都是抄我的!却惨遭「已读不回」
最近,LSTM之父Jürgen Schmidhuber一言不合又跟LeCun干上了! 其实之前稍微熟悉这位暴脾气大爷的同学都知道,特立独行的Jürgen Schmidhuber和机器学习社区的...
vue入门知识总结
1.插值表达式 {{}} 2.指令 2.1 v-if 、v-else、 v-show、v-else-if ...
Google earth engine——全球森林碳通量(2001-2021)数据集可视化含代码
全球森林碳通量(2001-2021) 森林碳净通量是指2001年至2021年期间森林与大气之间的碳净交换量,计算方法是模型期间森林排放的碳与森林移除(或封存)的碳之...
基于Python+unittest自动化测试框架说明文档
一、unittest自动化框架介绍.... - 5 - 1、unittest核心工作原理.... - 5 - 1.1、TestCase. - 5 - 1.2、TestSuite. - 6 - 1.3、...
金蝶EAS_WFLL2开发记录
代码参考 代码设置字段必录,非必录 isInvestChange:function(event,ui){ debugger; var value= ui.current; ...
Requests+Etree+BeautifulSoup+Pandas+Path+Pyinstaller应用 | 获取页面指定区域数据存入html、excel文档
(Requests+Etree+BeautifulSoup+Pandas+Path应用 | 获取页面指定区域数据存入html、excel文档),注意:请文明上网,本文仅作为学习用。讲述的是思路和方法,所...
10 个 Vue3 实战指南,冲就完事了
本篇介绍 10 点如何从实战中学习突破 Vue JS 3 的新特性,细细看完,一定会有收获~ 初始化挂载 在 Vue2 中,我们在 main.js 通常这样进行初始化挂载: ...
Vue最佳实践和实用技巧
1.props限制和透传 内自定义限制 props: { size: { // 自定义验证函数 validator: (val) => { return ['small', 'm...
预处理加速干货:大幅加速数据预处理、轻松定制高性能ML算子
Taichi能够更精细地控制并行和每个元素(element)的操作,极大地提升了用户操作的灵活性。而Torch则将这些细节抽象成张量(Tensor)级别的操作,使得用户能聚焦...
随机森林的训练过程
随机森林顾名思义,是用随机的方式建立一个森林,森林里面有很多的决策树组成,随机森林的每一棵决策树之间是没有关联的。在得到森林之后,当...
JavaScript 剪贴板 Clipboard 的那些事儿!
减轻阅读负担,启发创作心智,轻松学习 JavaScript 技巧,日拱一卒,jym,冲~ 本篇带来 —— JavaScript 剪贴板 Clipboard 的那些事儿! 复制粘贴就是互...
诺!给你「最酷」网页设计指南
作为一个优秀的 Web 前端开发者,如果不懂点用户体验设计(UED),任由 UI 搁那指指点点,那可真叫是:知三晓五 —— 就是不懂事(四)了! 别方,抱紧我!本...
智能决策技术在汽车行业的应用实践
随着新能源、自动驾驶、人工智能技术的发展,汽车行业的智能化水平也水涨船高。作为人工智能领域“皇冠上的明珠”,决策智能是如何推动汽车行业数字化转型的?...
React中Flux与redux
混合 react提供了组件的目的是为了复用虚拟DOM,所以react提供了混合的技术是为了复用组件的功能 在ES5中,我们可以通过mixins使用,继承对象中的属性和方...
React中路由中的redux和redux拓展
路由中使用redux 在路由中使用redux只需要两步 第一步 在路由策略组件中(如HashRouter),渲染Route组件,并在该Route路由规则组件中,引入connect方法处...
前端跨页面通信方案分析
大家好,我是 CoderBin,本次对前端跨页面通信方案进行总结分析,希望对大家有所帮助。 感谢大家的留言点赞收藏 ,在浏览器中,我们可以同时打开多个Tab页,每...
jQuery 密码验证和深入理解JSONP【前端jQuery框架】
,jQuery密码验证插件扩展了jQuery验证插件,并提供了两个组件: 用于评估密码相关因素的函数: 例如,大小写字母的混合、字符(数字、特殊字符)的混合、长度...
vue中工作总结-持续更新
1.vue中数据向下传递时,无法使用@close方法清除 原因:传递的时候需要进行一波深拷贝 方法:JSON.parse(JSON.stringify(obj)) 2.表格选择的时候无法再次...
这些前端新技术你很难再忽视了 —— Svelte
新系列《这些前端新技术你很难再忽视了》,包括:SolidJS、Svelte、Tauri、Bun、Schema等。每一个都引领前端技术演变趋势,很有必要了解。 咱们将采用 5W1H ...
从1小时到3.5分钟,Meta新算法一部手机搞定3D人脸数据采集
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。 搞定这样的人脸3D建模需要几步? 在数据采集的阶段,答案是:一部手机 + 3.5分钟。...
JS 变量、作用域与内存
JavaScript 高级程序设计第 4 版(后简称高程4),相较于第 3 版,增加了 ES6 至 ES10 的全新内容,删除了旧版过时的内容,并在原有基础上充实了更加翔实的内...
1.84Pb/s,两倍于全球互联网带宽总和:单激光器实现最快数据传输纪录
有些时候,人们形容网络的效率「不如卡车运硬盘」:亚马逊 AWS 就有一种名为 snowmobile 的服务,真的使用集装箱卡车,一次可以传输 100Pb。这种大号 U 盘传...
React中详解redux
redux redux严格按照flux思想实现的一套框架,实现了单一数据流向。 组成部分 redux由四部分组成 action 组件发布的消息 store 存储消息的 reducers 捕...
15年软件架构师经验总结:在ML领域,初学者踩过的五个坑
数据科学和机器学习正变得越来越流行,这个领域的人数每天都在增长。这意味着有很多数据科学家在构建他们的第一个机器学习模型时没有丰富的经验,而这也是错...
#yyds干货盘点#前端存储之indexDB
localStorage 是前端本地存储的一种,其容量一般在 5M-10M 左右,用来缓存一些简单的数据基本够用,毕竟定位也不是大数据量的存储。 在某些场景下 ...
Flask框架:如何运用Ajax轮询动态绘图
本文分享自华为云社区《Flask框架:运用Ajax轮询动态绘图》,作者:LyShark。 Ajax是异步JavaScript和XML可用于前后端交互,在之前《Flask 框架:运用...
夯实基础,不能忽视的“数据库”
如果我们把数据比作“米”,数据库就是“米仓”。没错,从标准定义来讲,数据库就是按照数据结构来组织,存储和管理数据的仓库。 数据库的设计初衷? 就像...
《领域驱动设计精粹》读书笔记
第一章DDD对我而言 还可以指引构建正确软件模型的方向。 领域驱动对团队人的要求较高: 具备深厚的业务能力(领域专家) 具备业务抽象能力; 具...
DataOps是“数据的DevOps”吗?
作者丨徐杰承 【51CTO.com原创稿件】DevOps 一直以来都是转变 IT 工作方式的主要催化剂,它能够使项目变得更加敏捷,使企业能够更快的对客户需求作出响...
流计算引擎数据一致性的本质
流计算的应用与实践在大数据领域越来越常见,其重要性不言而喻,常见的流计算引擎有 Google DataFlow、Apache Flink,Apache Kafka Streams,Apache Spark St...
如何应用数据模型?
一 前言 Vmo 是我在 18 年发布的一个工具库,用于快速创建数据模型,当时我写了一篇文章《Vmo 前端数据模型设计》得到过一段时间的关注,当时我从...
如何基于DataWorks构建数据中台?
为了应对众多业务部门千变万化的数据需求和高时效性的要求,阿里巴巴首次提出了数据中台的概念,经过众多项目的实践已经沉淀出了标准化的流程和方法论。...
40亿条/秒!Flink流批一体在阿里双11落地的背后
今年的双11,实时计算处理的流量洪峰创纪录地达到了每秒40亿条的记录,数据体量也达到了惊人的每秒7TB,基于Flink的流批一体数据应用开始在阿里巴巴最核心的...
快速入门数据结构和算法
有哪些常见的数据结构?基本操作是什么?常见的排序算法是如何实现的?各有什么优缺点?本文简要分享算法基础、常见的数据结构以及排序算法,给同学们带来一堂数...
高清视频下如何节省带宽?
数据显示,国内互联网流量每月被消耗 200EB,且 80% 的流量消耗来自于视频领域。随着 5G 的普及,云制播等得到快速发展,流量消耗会越来越大,而这背后是非常...
一文讲透 Git 底层数据结构和原理
本文将系统分享 Git 底层知识:对象生命周期变化,底层数据结构,数据包文件结构,数据包文件索引,以及详细分析对象查询流程和算法。 状态模型 ...
舟谱数据的执着与克制:有用是数据智能的金标准
IT未远,DT已至。 DT时代的到来,让“数据+算力”成为推动世界前进的新生源动力。当数据智能驱动产业变革的时代到来,无论你愿不愿意,都将置身DT...
它是真实的“盗梦空间”?在这里,一切都可能是数据
位于杭州阿里巴巴西溪园区旁边的大型商场“亲橙里”2018年正式开业。和传统的线下综合型商场不同的是,亲橙里从规划之初就定位为数字化商场,通过植入自研的IBO...
Python和Go实现简单Grpc服务
一、简介 Grpc 使用了 Google 的 Protocol Buffers 作为接口定义语言(IDL),并使用 HTTP/2 作为传输协议。它支持多种编程语言,包括 C++、Java、Python、G...
ReadProcessMemory可不是一个进程间通信的好方法
有时候我看到有人会使用 ReadProcessMemory 这个 API 来实现进程间通信,老实说吧,我觉得这不是一个明智的选择,原因有如下几条。 首先,你不能使用 ReadPr...
Java NIO 缓冲区完全指南:从基础到高级技巧
,Java NIO中的缓冲区(Buffer)是一个基本的数据结构,用于在Java程序中高效地读取和写入数据。缓冲区是一个连续的内存块,用于存储特定类型的数据。它提供了一...
并行计算框架Polars、Dask的数据处理性能对比
在Pandas 2.0发布以后,我们发布过一些评测的文章,这次我们看看,除了Pandas以外,常用的两个都是为了大数据处理的并行数据框架的对比测试。,,本文我们使用...
得物自建DTS平台的技术演进
DTS是数据传输平台(Data Transfer Platform的缩写),随着得物App的用户流量增长,业务选择的数据库越来越多样化,异构数据源之间的数据同步需求也逐渐增多。为...
一文带您快速入门Kafka
作者 | 蔡柱梁,审校 | 重楼,Kafka 是使用 Scala 语言开发的一个多分区、多副本且基于 ZooKeeper 协调的分布式消息系统。目前,它的定位是一个分布式流式处理...
Pandas对比Polars,语法和速度大PK
Pandas是数据科学中必不可少的Python库。但其最大的缺点是对大型数据集的操作速度较慢。Polars是一种旨在更快地处理数据的Pandas替代方案。,本文简要介绍了Po...
一种基于布隆过滤器的大表计算优化方法
在大数据行业内,尤其是数仓建设中,一直有一个绕不开的难题,就是大表的分析计算(这里的大表指亿级以上)。特别是大表之间的 Join 分析,对任何公司数据部...
转转C2B业务从零搭建精细化运营平台
在过去,为了提升用户从估价到下单各个阶段的转化率,业务会经常性地做一些活动投放或者用户召回等运营活动。这些活动往往都是粗投,没有细分用户群体。一是...
MetrAutoAPI系统架构设计
公司正在进行数据战略转型,因此我们面临的数据需求越来越多,而我们拥有的指标数据越来越丰富。不过,仅仅拥有数据并不够,我们需要能够更加灵活高效的使用...
数据测试:数据质量中缺少的组成部分
如果没有适当的数据测试,生产中的数据质量就是不完整的。在本文中,您将学习数据测试的基础知识以及如何开始。,,数据质量对于数据仓库、主数据管理(MDM)、...
轻松入门Python量化交易
数据科学是当前全球形势下快速发展的领域,它将统计学的力量与计算技术相结合,从数据中获取有价值的洞察。,数据科学家是负责将来自数学、统计学、计算机科学...
从数据到决策:项目管理和度量领域必备技能
“效率”作为得物技术部的关键词之一,大家在研发效能、会议效率、协作效率、办公效率等方面一直进行着持续地探索。在实际落地的过程中,为了更好地评估应用效...
提速10倍+,StarRocks 指标平台在携程火车票的实践
作者简介,Kane,携程高级数仓经理,专注数仓建设、数据应用和分析;,Wn,大数据平台开发专家,专注大数据领域。,携程火车票事业群运营着铁友、携程火车票和去...
值得与Python结合使用的五个新颖的数据科学工具
译者 | 布加迪,审校 | 重楼,Python庞大的数据科学工具生态系统对用户有很大的吸引力。生态系统如此庞大而丰富的唯一缺点是,有时最好的工具可能会被忽视。,,...
数据平台流量回放最佳实践
数据平台利用大数据智能分析、数据可视化等技术,对公司内外部经过采集、建设、管理、分析的多源异构数据进行呈现和应用,实现了数据共享、日常报表自动生成...
mysql蠕虫复制是什么意思
,说明,1、蠕虫复制将现有表中的复制数据直接插入另一个表(同一个表),2、蠕虫复制的目标是快速增加表中的数据,实现表中的数据复制(用于数据备份或迁移),指数...
如何使用 Python 进行数据科学
Python 是一种出色的数据分析语言,因为它包含各种数据结构、模块和工具。,,Python 易学,语法也比较简单。它是一种流行的数据科学语言,因为它功能强大且易...
一文搞懂模糊匹配:定义、过程与技术
译者 | 崔皓,审校 | 孙淑娟,,根据Accenture的一项调查显示,75% 的消费者更喜欢在知道他们名字和购买习惯的零售商那里消费,如果零售商无法对消费...
数组与链表,性能到底差多少?
同为基础的数据结构,数组与链表是最为常用的两个大类之一。,所谓数组,就是在内存中连续存储多个元素的结构,在内存中的分配也是连续的。数组中的元素通过数...
Python居然被用来开发游戏了?盘点你想不到的Python开发场景
,都说学 Python 好,好在哪?Python 可以用来做什么?,当 YouTube、 Quora、 Pinterest、 Facebook、 Reddit、 Instagram、 Google、 Netflix 和 Spotify 等...
mysql水平拆分是什么
,1、说明,水平拆分是通过某种战略将数据单片存储,单片存储器内的单片存储器和单片存储器两个部分,单片数据分散到不同的MySQL单片或单片存储器,达到分布式...
Kafka在美团数据平台的实践
作者:海源、仕禄、肖恩等,Kafka在美团数据平台承担着统一的数据缓存和分发的角色,随着数据量的增长,集群规模的扩大,Kafka面临的挑战也愈发严峻。,Kafka是...
python使用Pyecharts绘制疫情分布图
,为了密切关注疫情动态,使用Python实现将数据可视化在地图上吧。,Pyecharts 介绍,Apache Echarts 是一个由百度开源的数据可视化,凭借着良好的交互性,精巧...
Docker基础:数据卷技术介绍
今天给大家简单聊聊Docker中的数据卷知识。,,大家在生产环境使用Docker部署项目的时候,基本都需要进行数据持久化、或多个容器间进行数据共享,这个就需要容...
30 个数据工程必备的Python 包
Python 可以说是最容易入门的编程语言,在numpy,scipy等基础包的帮助下,对于数据的处理和机器学习来说Python可以说是目前最好的语言,在各位大佬和热心贡献...
Pandas:用于数据分析和数据科学的最热门 Python 库
,Pandas 为 Python 中数据分析提供了基础和高级的构建组件。Pandas 库是用于数据分析与数据操作的最强大和最灵活的开源分析工具之一,并且它还提供了用于建模...
Databricks与Snowflake究竟有哪些差别?
译者 | 陈峻,审校 | 孙淑娟,作为一种分析类中央存储库,数据仓库可用于存储已结构化、且已过滤的数据。而作为数据仓库典型用户的数据分析师,他们通常拥有着...
聊聊 13 种锁的实现方式
,最近有很多小伙伴给我留言,分布式系统时代,线程并发,资源抢占,'锁' 慢慢变得很重要。那么常见的锁都有哪些?,今天Tom哥就和大家简单聊聊这个话题。,正如...
机械硬盘物理损坏如何数据恢复
机械硬盘物理学毁坏假如在电脑上能一切正常载入,可以使用数据信息恢复工具开展恢复。 1、以超级兔子数据信息恢复软件为例子,开启软件操作界面,点一下情景...
Python 实现八个概率分布公式及可视化
,概率和统计知识是数据科学和机器学习的核心;我们需要统计和概率知识来有效地收集、审查、分析数据。,现实世界中有几个现象实例被认为是统计性质的(即天气...
九个超级实用的数据科学Python库
Python 是一个很棒的语言。它是世界上发展最快的编程语言之一。它一次又一次地证明了在开发人员职位中和跨行业的数据科学职位中的实用性。整个 Python 及其库...
python迭代器的优缺点
,说明,1、迭代器优点,节省内存,迭代器在内存中相当于只占一个数据的空间。,因为每次取值都上一条数据会在内存释放,加载当前的此条数据。,惰性机制。,next...
现代企业数据架构的关键要素
译者 | 陈峻,审校 | 孙淑娟,不知您是否注意到,现代企业数据架构的概念化设计,对于企业的数据掌控与“变现”能力,起着至关重要的作用。此处的现代企业架构主...
一行Pandas代码制作数据分析透视表,太牛了!
那我们第一步仍然是导入模块并且来读取数据,数据集是北美咖啡的销售数据,包括了咖啡的品种、销售的地区、销售的利润和成本、销量以及日期等等。,那小编这里...
Redis 定长队列的探索和实践
从技术的角度来说,技术方案的选型都是受限于实际的业务场景,都以解决实际业务场景为目标。,在我们的实际业务场景中,需要以游戏的维度收集和上报行为数据,...
一行代码制作数据分析交叉表,太便捷了
,在前文中我们了解到Pandas模块中的pivot_table()函数可以用来制作数据透视表。,那我们按照惯例,首先导入模块并且来读取所要使用到的数据集,引用的依然是之...