您现在的位置:首页 >> 省钱攻略

T-thinker | MapReduce, Apache Spark后的下一代大数据并行程式设计框架

发布时间:2025/10/18 12:17    来源:雨花台家居装修网

计和演算法研究课题的学者(各行各业方知文本再一哈,不用走开!),那让我们看看 T-thinker 的研究课题可以在顶级算出机全体会议和出版物上有多高产!值得同样的是,T-thinker 是一个非常更进一步 topic:初步的概念出版在此番等在 PPoPP’19 上的海报(poster)文章《T-thinker: A Task-Centric Distributed Framework For Compute-Intensive Divide-and-Conquer Algorithms》上,并且被算出研究课题协会(CRA)的算出社区联盟(CCC)评为伟大的新创意之一(,方知绘出 2)。可以看 YouTube 的小伙伴们的可以戳这里看 T-thinker 系统设计性的介绍性稍短视频: (方知绘出 3)。

绘出 2:T-thinker 被评为 CCC Great Innovative Idea。

绘出 3:CCC 年前期职业学者研讨会上此番对 T-thinker 的介绍性稍短视频

从 2020 年开始此番的研究课题小组开始根据 T-thinker 开放性开发计划了一系列大将近据挖掘出系统设计,均出版在检索最顶级的全体会议及出版物上。第一个系统设计是 G-thinker,应用于彻底解决从大绘出上寻告诉他满足服务器定义的情况下的子绘出实例的缺陷,比如将近直角三角形,告诉他高密度子绘出(比如对应社交团体)以及子绘出归一化。G-thinker 可以通过 到访(方知绘出 4),其开发计划给予旧金山科学基金(NSF),东部大将近据里面枢(South BD Hub)以及IBM的 Azure 皓应用软件的支助。出版的系统设计性文章顶会顶刊皓集,最主要:

G-thinker: A Distributed Framework for Mining Subgraphs in a Big Graph (ICDE’20) Scalable Mining of Maximal Quasi-Cliques: An Algorithm-System Codesign Approach (PVLDB’20) G-thinker: A General Distributed Framework for Finding Qualified Subgraphs in a Big Graph with Load Balancing (VLDB Journal 2022) Parallel Mining of Large Maximal Quasi-Cliques (VLDB Journal, accepted in 2021) Maximal Directed Quasi-Clique Mining (ICDE’22)

此番麻省理工学院生郭桂木(同济的大学学位)在 G-thinker 研究课题方面做了重要成就,并于月份(2022)给予了旧金山麻萨诸塞州 Rowan 的大学长聘轨制助理任教的职位。其他麻省理工学院在念过小组团体也是顶会顶刊文章皓集,并仍要不断着手开发计划更进一步基于 T-thinker 开放性的将近据挖掘出系统设计。

绘出 4:G-thinker 系统设计首页。

第二个基于 T-thinker 开放性的系统设计是 PrefixFPM,应用于在事务(transaction)检索上挖掘出各种时有的方式 (pattern),即被超过一定指定将近量事务包含的方式。方式的类型由服务器灵活指定,最主要 itemset,子树,子绘出,甚至是子矩阵。出版的系统设计性文章也是顶会顶刊皓集,最主要:

PrefixFPM: A Parallel Framework for General-Purpose Frequent Pattern Mining (ICDE’20) Parallel Mining of Frequent Subtree Patterns (LSGDA@VLDB’20, invited keynote) PrefixFPM: A Parallel Framework for General-Purpose Mining of Frequent and Closed Patterns (VLDB Journal 2022) Mining Order-Preserving Submatrices Under Data Uncertainty: A Possible-World Approach and Efficient Approximation Methods (ACM TODS, accepted in 2022)

时有方式挖掘出的另一个环境设定是慎重考虑一个单独的大事务,比如一张大绘出或者一个地理空间将近据集 (for colocation patterns)。与该环境设定对应的系统设计此番的麻省理工学院生 Lyuheng Yuan(UPenn 学位)仍要在如火如荼的开发计划里面,似乎不久后就会投入生产。

第三个基于 T-thinker 开放性的系统设计是 TreeServer,应用于实现基于一个通用的各种估测,最主要 deep forest 这样的大模型。系统设计性文章《Distributed Task-Based Training of Tree Models》月份在 ICDE’22 上出版。

值得同样的是,T-thinker 系列系统设计的研究课题某种程度刚刚开始,而且此番研究课题小组现有还有好多系统设计性系统设计仍然筹划好排着马队到时开发计划!似乎还有非常多的研究课题机会到时大家开掘(突击要快速喔)!此番第一个麻省理工学院生郭桂木(大弟子)在 IEEE BigData 2020 对这个方向有个引论报告(tutorial),您很感兴趣的话赞许到访 参观者。希望到这里我仍然恳求你来明白下 T-thinker 其实是什么,以及我们 T-thinker 的系统设计性工作了。

什么?你是工各行各业的且对发系统设计文章不感兴趣?别走开啊,同样我们的题目:T-thinker 是继 MapReduce, Apache Spark 便的下一代大将近据借助于脚本语言开放性!T-thinker 克服了现在将近据密集型系统设计对算出密集型护航的执行取而代之缺陷,但是它比方说可以高效默许将近据密集型护航!发现了吗?T-thinker 可能是取而代之 Spark 等大将近据脚本语言开放性的下一代脚本语言模型!说明了很难,现在大家都用 Spark 仍然没什么人用过时的 MapReduce 了…

打算不打算成为自己公司第一个启动 T-thinker 脚本语言开放性项目或者 T-thinker 皓应用软件默许的主任?还等什么,回头问一下下面为时一小时干货满满的系列讲座,详尽明白下 T-thinker 的技术概念吧!

视频URL:_id_from=333.999.0.0

江苏不孕不育医院怎么去
湖北皮肤病医院排行
西安妇科医院
深圳看白癜风哪里最好
南昌包皮过长治疗医院
小儿便秘怎么办
治支气管炎咳嗽的药有什么
痱子湿疹
科普视频
咳嗽黄痰可以喝太极急支糖浆吗

上一篇: 手机界内的“LV”,真我新机外观公布,网友:年度质感旗舰稳了

下一篇: 中年女性职场穿搭按照这个思路来,精致干练又澹老气,谁穿谁美

友情链接