-
81个开源大数据处理工具汇总(下),包括日志收集系统/集群管理/
所属栏目:[大数据] 日期:2021-02-24 热度:84
上一部分:http://my.oschina.net/u/2391658/blog/711016 第二部分主要收集整理的内容主要有日志收集系统、消息系统、分布式服务、集群管理、RPC、基础设施、搜索引擎、Iaas和监控管理等大数据开源工具。 ? 日志收集系统 一、Facebook?Scribe 贡献者 :Faceb[详细]
-
81个开源大数据处理工具汇总(上),包括查询引擎/流式计算/存储
所属栏目:[大数据] 日期:2021-02-24 热度:141
本文一共分为上下两部分。我们将针对大数据开源工具不同的用处来进行分类,并且附上了官网和部分下载链接,希望能给做大数据的朋友做个参考。下面是第一部分。 查询引擎 一、Phoenix 贡献者::Salesforce 简介:这是一个Java中间层,可以让开发者在Apache H[详细]
-
开源大数据查询分析引擎现状
所属栏目:[大数据] 日期:2021-01-27 热度:74
文|叶蓬 【按:此文是与我的《基于大数据分析的安全管理平台技术研究及应用》同期发表在内刊上的我的同事们的作品,转载于此。这些基础性的研究和测试对比分析,对于我们的BDSA技术路线选定大有帮助。】 引言 大数据查询分析是云计算中核心问题之一,自从Goo[详细]
-
【数位DP】HDU3565-Bi-peak Number
所属栏目:[大数据] 日期:2021-01-27 热度:139
题目链接:http://acm.split.hdu.edu.cn/showproblem.php?pid=3565 Problem Description A peak number is defined as continuous digits {D0,D1 … Dn-1} (D0 0 and n = 3),which exist Dm (0 m n - 1) satisfied Di-1 Di (0 i = m) and Di Di+1 (m = i n -[详细]
-
LightOJ1282 Leading and Trailing 大数取首尾
所属栏目:[大数据] 日期:2021-01-27 热度:175
任何一个数都可以转换为10^k,k是一个小数,k的整数部分决定了这个数的位数,小数部分决定了每一位的值,根据此可以快速找到前三位。 通过快速幂取模可以快速找到后三位。 题目链接:http://acm.hust.edu.cn/vjudge/problem/26992 #pragma comment(linker,"/[详细]
-
数据处理之——data.table
所属栏目:[大数据] 日期:2021-01-27 热度:163
data.table 简介 关于 R 中的数据处理,我们接着介绍 data.table 包。上期我们介绍的 dplyr 有类似于sql的一套数据处理的语法,而 data.table 则有着它自己的一套语法,它能处理几乎所有 dplyr 可以处理的数据,而且代码量更少,效率更高,特别是在处理大至G[详细]
-
日均请求量百亿级数据处理平台的容器云实践
所属栏目:[大数据] 日期:2021-01-27 热度:116
from:?http://geek.csdn.net/news/detail/97887 声明: 本文为CSDN原创投稿文章,未经许可,禁止任何形式的转载。? 作者: 袁晓沛,目前在七牛云的主要工作是基于容器平台构建分布式应用,借助容器的优势,实现大规模分布式应用的自动化运维以及高可用,以Pa[详细]
-
如何计算文档相似性
所属栏目:[大数据] 日期:2021-01-27 热度:159
最近课题需要,整理一下文档相似性的一些研究,主要是参考知乎上面的回答和52nlp的相关文章。以备后期综述使用。具体还需要好好细读链接。 主要思路 01/one hot representation,BOW+tf-idf+LSI/LDA体系. docsim方法:gensim包,使用corpora.Dictionary(text[详细]
-
关联规则挖掘——Apriori算法
所属栏目:[大数据] 日期:2021-01-27 热度:162
前言 大二的时候,一个老师为了勾起我们对数据挖掘的兴趣,老是问我们这个问题:你们知道超市为什么要把啤酒跟尿布放在一起吗?但是从来没告诉我们答案。现在,很多人都听过这个问题,觉得很平常,但是那时的我真觉得挺神奇的。直到后来,了解了关联规则挖掘[详细]
-
在「不稀缺」的商业世界,如何挖掘稀缺的资源?
所属栏目:[大数据] 日期:2021-01-27 热度:60
要生存壮大,就要找到新的稀缺资源, 并且想尽办法掌握在自己手中。 文 | 曲凯 编者按:本文来源42章经(ID:MyFortyTwo),一家生产原创优质内容的科技媒体,誓同有趣、有料、有企图心的灵魂共成长。 “Technology increases access to what is scarce. ”[详细]
-
新闻中文本地域信息标签的抽取
所属栏目:[大数据] 日期:2021-01-27 热度:58
这里主要是基于规则的新闻地域提取方法,这里简要记录一下思路。 首先我们拥有了地域信息数据库,并且标注了省市的layer层信息。主要思路是利用nlp库,分词得到标有地名属性词,在于地域数据库匹配。 第一步,提取正文分词得到标注为地名的词语。 第二步,匹[详细]
-
视音频数据处理入门:H.264视频码流解析
所属栏目:[大数据] 日期:2021-01-27 热度:100
===================================================== 视音频数据处理入门系列文章: 视音频数据处理入门:RGB、YUV像素数据处理 视音频数据处理入门:PCM音频采样数据处理 视音频数据处理入门:H.264视频码流解析 视音频数据处理入门:AAC音频码流解析[详细]
-
hdu5834 Magic boy Bi Luo with his excited tree(树形dp)
所属栏目:[大数据] 日期:2021-01-25 热度:199
Magic boy Bi Luo with his excited tree Time Limit: 8000/4000 MS (Java/Others)????Memory Limit: 131072/131072 K (Java/Others) Total Submission(s): 723????Accepted Submission(s): 192 Problem Description ? Bi Luo is a magic boy,he also has a[详细]
-
HDU 1042 N! N的阶乘(大数)
所属栏目:[大数据] 日期:2021-01-25 热度:51
N! Time Limit: 10000/5000 MS (Java/Others)????Memory Limit: 262144/262144 K (Java/Others) Total Submission(s): 75303????Accepted Submission(s): 21981 Problem Description Given an integer N(0 ≤ N ≤ 10000),your task is to calculate N! ? In[详细]
-
机器学习物语(2):大数定理军团
所属栏目:[大数据] 日期:2021-01-25 热度:146
机器学习理论帝国崛起,大数定理军团功不可没,称之为军团毫不夸张,在前军先锋强大数定理和副将弱大数定理后面,是铠甲上刻着“Concentration of Measure”的古老印记的战士们,不妨暂且忽略他们之间乱七八糟的“血缘”关系,而罗列一些名字:Chebyshev 不[详细]
-
大数取模 HDU 5832
所属栏目:[大数据] 日期:2021-01-24 热度:129
int mod(char str[],int num) { int remainder=0; int len = strlen(str); for(int i=0;ilen;i++) { remainder=(remainder*10+(str[i] - '0'))%num; } return remainder;} HDU 5832 题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=5832 题意:能被73[详细]
-
原来地铁都用这个挖!盾构机,简直是挖掘神器!
所属栏目:[大数据] 日期:2021-01-24 热度:150
(点击 上方公号 ,可快速关注) 转自:cax360 演示视频 ↓↓↓ 盾构隧道掘进机 ,简称盾构机。是一种隧道掘进的专用工程机械,现代盾构掘进机集光、机、电、液、传感、信息技术于一体,具有开挖切削土体、输送土碴、拼装隧道衬砌、测量导向纠偏等功能。盾构[详细]
-
【HDOJ 5834】Magic boy Bi Luo with his excited tree(树型DP
所属栏目:[大数据] 日期:2021-01-24 热度:117
【HDOJ 5834】Magic boy Bi Luo with his excited tree(树型DP) Magic boy Bi Luo with his excited tree Time Limit: 8000/4000 MS (Java/Others)????Memory Limit: 131072/131072 K (Java/Others) Problem Description Bi Luo is a magic boy,he also ha[详细]
-
全自动挖洞?正确姿势看首届「CGC人机漏洞挖掘对战赛」
所属栏目:[大数据] 日期:2021-01-24 热度:86
*本文原创作者:Arthur Sphinx,转载许可请联系editor@tophant.com 随着人工智能技术的进步,各种棋类高手一一被电脑斩落马下,围棋是人类硕果仅存的骄傲,但在 2016年3月 的世纪之战中,谷歌旗下的AlphaGo电脑却成功击败韩国九段棋手李世石,而这也被认为是[详细]
-
多数组k大数 -- 二分思路
所属栏目:[大数据] 日期:2021-01-24 热度:170
多数组k大数 给定两个有序数组arr1和arr2,在给定一个整数k,返回两个数组的所有数中第K小的数。 例如: arr1 = {1,2,3,4,5}; arr2 = {3,5}; K = 1; 因为1为所有数中最小的,所以返回1; arr1 = {1,3}; arr2 = {3,5,6}; K = 4; 因为3为所有数中第4小的数,所[详细]
-
树形dp____Magic boy Bi Luo with his excited tree( hdu 5834 2
所属栏目:[大数据] 日期:2021-01-24 热度:112
Problem Description Bi Luo is a magic boy,he also has a migic tree,the tree has? N ?nodes,in each node,there is a treasure,it's value is? V [ i ] ,and for each edge,there is a cost? C [ i ] ,which means every time you pass the edge? i ?,yo[详细]
-
HDU1402 A * B Problem Plus 大数乘法 FFT(快速傅里叶变换)优化
所属栏目:[大数据] 日期:2021-01-24 热度:109
HDU1402 A * B Problem Plus 大数乘法 FFT(快速傅里叶变换)优化 题目 长度不超过5000,据称高精度会TLE,必须 O ( n l o g n ) ,FFT首敲。 代码 bit_reverse_swap(a,n) 参考自算法导论30.3的迭代实现,非递归方式完成下图过程。 #include cstdio #include c[详细]
-
十大数据分析站长是否作bi
所属栏目:[大数据] 日期:2021-01-24 热度:101
作bi手段愈发多样化和智能化的今天,广告联盟如何应对于,怎么才能确保广告效果最大化是当务之急,不然广告效果得不到保证,广告商会急剧减少,甚至不乏影响联盟信誉以至联盟倒闭者。 1、 IP防止作bi 一般计费方法是依照24小时内独一IP,可以将每个IP记入数[详细]
-
HDOJ 5832 a water problem(大数取模)
所属栏目:[大数据] 日期:2021-01-24 热度:89
Problem Description Two planets named Haha and Xixi in the universe and they were created with the universe beginning. There is? 73 ?days in Xixi a year and? 137 ?days in Haha a year.? Now you know the days? N ?after Big Bang,you need to a[详细]
-
hdu2054 A == B ? (大数)
所属栏目:[大数据] 日期:2021-01-24 热度:136
A == B ? Time Limit: 1000/1000 MS (Java/Others)????Memory Limit: 32768/32768 K (Java/Others) Total Submission(s): 91202????Accepted Submission(s): 14548 Problem Description Give you two numbers A and B,if A is equal to B,you should print "[详细]
