-
华为提出面向YB数据时代存储产业演进方向
5月24日消息,近日,华为在2023创新数据基础上设施论坛上,华为表示数据存储行业正在迎来YB数据时代,数据数据存储在不断追求大容量、高性能的同时,还需要通过构建新的数据范式、智能的数据编织、内生的数据韧性,助力企业释放海量数据价值,也使能数据存储产业的飞速发展。华为公司副总裁、数据存储产品线总裁周跃峰指出,纵观全球整个数据存储产业,2022年全球前五名外置存储厂商发货容量是2012年的3倍,相比于正在迎来的YB数据时代,这还远远不够。华为预测2032年这一数字将实现10倍增长,超过100EB。数据存储在不断追求大容量、高性能的同时,还需要通过构建新的数据范式、智能的数据编织、内生的数据韧性,助力企业释放海量数据价值,也使能数据存储产业的飞速发展。华为认为,随着数字化转型的深入,数据存储产业正在迎来巨大的变革和发展机会。首先,数据应用日新月异,56%的企业都在部署AI应用;同时96%的企业计划构建云原生应用。其次,数据爆炸式增长,80%新增的数据为非结构化数据,年复合增长率达到38%。最后,数据韧性挑战日益严峻,勒索病毒变种快,同比增加98%,而且14.1%的企业遭受勒索攻击后数据无法恢复。非结构化数据正在进入企业生产决策系统,实时的访问让数据热度不断提升,分布式存储的读写带宽和IO访问效率需要得到数量级的提升。同时,分布式存储需要在软件、算法以及硬件方面通过系统性创新,满足海量非结构化数据对极致成本效益的要求。此外,数据规模的增长带来严重的数据重力问题,需要构建智能的数据编织能力,实现跨系统、跨地域、跨云的全局统一数据视图和调度。数据安全威胁正在从自然灾害、物理损坏向勒索软件等人为攻击转变,企业需要从被动响应走向主动防御,提升数据韧性。零日漏洞的增加、数据无法恢复带来的巨大损失,使得以网络、应用、主机安全构成的企业数据安全体系不足以满足企业最新的数据韧性需求。数据存储正在成为守护数据安全的最后一道防线,更多的数据韧性能力将被内嵌到数据存储产品中,例如勒索检测、数据加密、安全快照和AirGap隔离区恢复特征等。周跃峰指出,华为数据存储携手客户与伙伴共同成长,提供产品与解决方案,其中OceanStor Dorado全闪存存储和OceanStor Pacific分布式存储均荣获2023 Gartner Peer Insights“客户之选”。(静静) ...
电信通讯 2023-05-24 09:47:44 -
打官司前奏?马斯克向微软发律师信指责其滥用推特数据
马斯克的御用律师阿历克斯·斯皮罗(Alex Spiro)周四致信微软,指责该公司滥用推特的数据,并要求这家软件巨头进行审计。 这封信主要针对微软涉嫌从推特的推文数据库中获取信息的一系列看似有限的违规行为...
智能设备 2023-05-20 11:25:40 -
苹果也出手了!以数据安全为由限制员工使用ChatGPT等AI工具
①有消息称,苹果公司已经限制员工使用ChatGPT和其他外部的AI工具; ②苹果担心此类工具会泄露公司机密数据; ③知情人士透露,苹果正在开发自己的大型语言模型。 财联社5月19日讯(编辑 周子意)据媒体周四(5月18日)援引一份文件内容称,苹果公司已经限制员工使用ChatGPT和其他外部的人工智能(AI)工具...
智能设备 2023-05-19 11:51:52 -
马斯克对微软出手了,推特指责其滥用数据,未来要收钱?
5月19日消息,美国当地时间周四,社交媒体平台推特致信微软首席执行官萨蒂亚·纳德拉(Satya Nadella),指责微软不当使用推特的数据,违反了数据使用协议,还拒绝付费。推特称,微软使用的推特数据超过了协议中约定的限制,并且未经许可与政府机构分享了其中的部分数据。推特首席执行官埃隆·马斯克(Elon Musk)的私人律师亚历克斯·斯皮罗(Alex Spiro)在信中写道:“微软可能长期违反了相关协议的多项条款。”这封信可能是推特试图向微软收取数据使用费用的前奏。去年,马斯克以440亿美元的价格收购了推特。他曾表示,公司赚钱是当务之急,推特已经濒临破产。之后,推特推出了新的订阅服务,并采取其他措施来增加收入。今年3月,该公司表示将向开发者收取更高的费用,以获得访问推特API的权限。上个月,马斯克公开指责微软“非法”使用推特数据来训练其人工智能技术。他在推特上写道:“诉讼时间到了。”微软承认目前没有为使用推特数据而向其付费。该公司发言人弗兰克·肖(Frank Shaw)表示,微软已收到推特的信函,将审查这些问题并作出回应。他还表示,“我们期待继续与该公司保持长期合作关系。”马斯克没有回应置评请求。最近,马斯克和微软的关系有点紧张,他们曾就OpenAI的问题争执不下。马斯克在2015年参与了OpenAI创立,但后来退出。马斯克称,微软已向OpenAI投资了超过130亿美元,并且现在控制了该公司的商业决策权,但微软对此表示异议。上个月,微软表示不会为访问推特数据支付费用,并告知其广告平台的客户,将从平台中移除推特。据悉,广告商使用微软的广告平台来管理其社交媒体账户,包括推特。最近几个月,推特和其他组织也开始抱怨,他们的数据被用于构建新一代人工智能技术。Reddit上个月表示,将开始对访问其应用程序编程接口(API)收费,数据不能再免费使用。微软的必应聊天机器人和OpenAI的ChatGPT都建立在大语言模型的基础上,这些模型通过分析从互联网上收集的海量数据来改进自身。去年12月,马斯克切断了OpenAI与推特的数据联系。OpenAI每年为访问这些数据支付200万美元,但马斯克认为,这笔钱不足以公平地补偿推特。在给纳德拉的信中,斯皮罗并未具体说明推特是否会采取法律行动或要求经济赔偿,但要求微软遵守推特的开发者协议,并检查其8款应用程序的数据使用情况。推特还要求微软在6月份之前提交一份报告,说明该公司拥有多少推特数据,这些数据是如何存储和使用的,以及政府相关组织何时获得这些数据的访问权限。推特的规定禁止政府机构使用其数据,除非事先得到通知。信中还提到,微软的游戏系统Xbox、搜索引擎必应以及其他几种广告和云计算工具都使用了推特的数据。推特对其他公司使用其数据的数量进行了限制,称不能超过“合理的数值”。信中写道,仅在2022年,微软使用推特数据门户的次数就超过了7.8亿次,检索了超过260亿条推文。(小小) ...
业界动态 2023-05-19 08:31:57 -
谷歌PaLM2训练所用文本数据量是初代的近5倍
5月17日消息,谷歌上周在2023年I/O开发者大会上推出最新大型语言模型PaLM 2。公司内部文件显示,自2022年起训练新模型所使用的文本数据量几乎是前一代的5倍。据悉,谷歌最新发布的PaLM 2能够执行更高级的编程、运算和创意写作任务。内部文件透露,用于训练PaLM 2的token数量有3.6万亿个。所谓的token就是字符串,人们会将训练模型所用文本中的句子、段落进行切分,其中的每个字符串通常被称为token。这是训练大型语言模型的重要组成部分,能教会模型预测序列中接下来会出现哪个单词。谷歌于2022年发布的上一代大型语言模型PaLM在训练中使用了7800亿个token。尽管谷歌一直热衷于展示其在人工智能技术领域的实力,说明如何将人工智能嵌入到搜索引擎、电子邮件、文字处理和电子表格中,但一直不愿公布训练数据的规模或其他细节。微软支持的OpenAI也对最新发布的GPT-4大型语言模型细节保密。两家公司都表示,不披露这些信息的原因是人工智能行业存在激烈竞争。谷歌和OpenAI都想要吸引那些希望使用聊天机器人而不是传统搜索引擎搜索信息的用户。但随着人工智能领域竞争的白热化,研究界要求提高透明度。自推出PaLM 2以来,谷歌一直表示,新模型比之前的大型语言模型更小,这意味着该公司技术在完成更复杂任务时能变得更高效。参数(parameters)通常用于说明语言模型的复杂性。根据内部文件,PaLM 2接受了3400亿个参数的训练,初代的PaLM接受了5400亿个参数的训练。谷歌没有立即发表评论。谷歌在一篇关于PaLM 2的博客文章中表示,新模型使用了一种名为“计算最优缩放”(compute-optimal scaling)的“新技术”,能使得PaLM 2“更高效,整体性能更好,比如推理更快、服务参数更少,服务成本也更低。”在发布PaLM 2时,谷歌透露新模型接受了100种语言的训练,并能胜任各种各样的任务。包括谷歌试验性聊天机器人Bard在内的25项功能和产品用的都是PaLM 2。PaLM 2按参数规模有四个不同的版本,从小到大依次是Gecko(壁虎)、Otter(水獭)、Bison(野牛)和Unicorn(独角兽)。根据谷歌公开披露的信息,PaLM 2比任何现有模型都更强大。Facebook在今年2月份宣布推出名为LLaMA的大型语言模型,其在训练中用了1...
业界动态 2023-05-17 13:33:30 -
SQLite3数据库的介绍和使用教程(面向业务编程-数据库)
目录SQLite3数据库的介绍和使用(面向业务编程-数据库)SQLite3介绍获取SQLite3源码编写CMake工程main.cpp编译使用SQL安装一个SQLite3建表插入行查找数据删除一项数据更新字段SQL总结C语言编程打开和关闭一个数据库文件打开一个数据库文件关闭一个数据库句柄执行SQLite语句不带回调带回调sqlite3_get_tableSQLitecpp源文件编写CMake工程总结SQLite3数据库的介绍和使用(面向业务编程-数据库)SQLite3介绍SQLite是一种用C语言实现的的SQL数据库它的特点有:轻量级、快速、独立、高可靠性、跨平台它广泛应用在全世界范围内的手机电脑应用的内建数据库官网地址:https://www...
数据库操作教程 2023-05-12 12:13:39 -
SQL中去除重复数据的几种方法汇总(窗口函数对数据去重)
目录方法1:distinct方法2:group by方法3:窗口函数使用SQL对数据进行提取和分析时,我们经常会遇到数据重复的场景,需要我们对数据进行去重后分析。以某电商公司的销售报表为例,常见的去重方法我们用到distinct 或者group by 语句, 今天介绍一种新的方法,利用窗口函数对数据去重...
数据库操作教程 2023-05-12 12:13:26 -
Linux安装ODBC连接SQLServer数据库的步骤
目录1、下载ODBC安装包2、安装步骤第一步:上传两个安装包到服务器上第二步:安装unixODBC,先安装这个,后安装freetds2.1、操作系统先安装gcc:2...
数据库操作教程 2023-05-12 12:13:06 -
SQLServer数据库密码短时间强制过期的解决
1、打开Sqlserver,选择登录名下的账户右击点击属性2、右击点击属性查看强制过期是否被勾选上,如勾选上,会在一段时间后该账户不能正常使用3、修改 过期的时间,这个过期时间是根据windows 的时间策略制定的windows 运行 输入 gpedit.msc按照下图打开选择密码策略 修改密码最长使用期限,就可以达到 延长效果了到此这篇关于SQLServer数据库密码短时间强制过期的解决的文章就介绍到这了,更多相关SQLServer密码强制过期内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家! ...
数据库操作教程 2023-05-12 12:13:01 -
SQL Server 2012 搭建数据库AlwaysOn(数据库高可用集群)
要实现数据库高可用集群,需要考虑以下几个方面:1. 数据库选择选择一个支持高可用的数据库。目前常用的高可用数据库包括mysql cluster、mongodb、postgresql、oracle rac、sql server alwayson等。2...
数据库操作教程 2023-05-12 12:12:42 -
使用SQL Server分区表功能提高数据库的读写性能
一般来说一个系统最先出现瓶颈的点很可能是数据库。比如我们的生产系统并发量很高在跑一段时间后,数据库中某些表的数据量会越来越大。海量的数据会严重影响数据库的读写性能。这个时候我们会开始优化系统,一般会经过这么几个过程:找出SQL慢查询,针对该SQL进行优化,比如改进SQL的写法,查看执行计划对全表扫描的字段建立索引引入缓存,把一部分读压力加载到内存中读写分离引入队列,把并发的请求使其串行化,来减轻系统瞬时压力分表/分库对于第五点优化方案我们来细说一下。分表分库通常有两种拆分维度:1.垂直切分,垂直切分往往跟业务有强相关关系,比如把某个表的某些不常用的字段迁移出去,比如订单的明细数据可以独立成一张表,需要使用的时候才读取 2...
数据库操作教程 2023-05-12 12:12:34