基于核心标签的可重叠微博网络社区划分方法被引量：7

An Overlapping Microblog Community Detection Algorithm via Core Tags

下载PDF

导出

摘要针对传统微博社区发现算法内聚低重叠度不可控制等问题,以自顶向下的策略,提出一种基于核心标签的可重叠微博社区发现策略Tag Cut.先利用用户标签的共现关系及逆用户频率对标签进行加权,并基于标签之间的内联及外联关系并将用户的标签进行扩充,然后在整体社区中提取包含某一标签的用户作为临时分组并利用评价函数评估划分的优劣,最后选出最合适的核心标签根据其对应分组与其他分组距离的远近来决定将其划分为新的分组还是并入其他分组.用此策略反复迭代直到满足要求.该算法划分的组由若干个拥有核心标签的分组组成且综合利用微博用户已声明的及隐含的兴趣、用户之间的关注规律、结果的实用性对划分结果进行修正.经真实数据实验表明该方法内聚高社区重叠度可控且拥有实际意义. The traditional microblog community detection algorithm has the characteristic of low coupled clustering and the overlapping degree can not be controlled. In this paper, we present a divisive approach for overlapping microblog community detection algorithm via core tags. Firstly,the key idea is to develop a tag weighing strategy by taking advantage of the co-occur- rence of tags and inverse user frequency. Then tag correlation can be exploited,which investigates both inter and intra correlation of tags ,and the tags for users can therefore be expanded. Users containing certain tag in the whole community are extracted as a temporary group and the quality value is calculated under the current partition. The most appropriate core tag is selected and the corresponding group is then updated until certain requirements are satisfied. The commtmity detected by this algorithm share com- mon core tags and the partition results can be revised based on the explicit and implicit interest of users ,together with the users＇ attention and practical application. Experimental results show that the method is effective and has practical significance.

作者马慧芳谢蒙何廷年蔺想红

机构地区西北师范大学计算机科学与工程学院中国科学院计算技术研究所智能信息处理重点实验室北京师范大学信息科学与技术学院

出处《电子学报》 EI CAS CSCD 北大核心 2017年第4期769-776,共8页 Acta Electronica Sinica

基金国家自然科学基金(No.61363058 No.61163039) 甘肃省青年科技基金(No.145RJYA259 No.1606RJYA269) 甘肃省自然科学研究基金(No.145RJZA232) 中国科学院计算技术研究所智能信息处理重点实验室开放基金(No.IIP2014-4)

关键词微博网络可重叠社区划分核心标签用户关注关系标签划分 microblog network overlapping community detection core tag user attention relationship tag cut

分类号 TP393.092 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献9

1张桂杰,张健沛,杨静,辛宇.基于链接相似性聚类的重叠社区识别[J].电子学报,2015,43(7):1329-1335. 被引量：4
2张伟哲,王佰玲,何慧,谭卓鹏.基于异质网络的意见领袖社区发现[J].电子学报,2012,40(10):1927-1932. 被引量：9
3王诗懿,董一鸿,李志超,陈华辉,钱江波.大规模复杂网络下重叠社区的识别[J].电子学报,2015,43(8):1575-1582. 被引量：3
4张引,张斌,高克宁,郭朋伟,孙达明.面向自主意识的标签个性化推荐方法研究[J].电子学报,2012,40(12):2353-2359. 被引量：8
5冷作福.基于贪婪优化技术的网络社区发现算法研究[J].电子学报,2014,42(4):723-729. 被引量：14
6周小平,梁循,张海燕.基于R-C模型的微博用户社区发现[J].软件学报,2014,25(12):2808-2823. 被引量：25
7尹丹,高宏,邹兆年.一种新的高效图聚集算法[J].计算机研究与发展,2011,48(10):1831-1841. 被引量：8
8孙怡帆,李赛.基于相似度的微博社交网络的社区发现方法[J].计算机研究与发展,2014,51(12):2797-2807. 被引量：24
9于海,赵玉丽,崔坤,朱志良.一种基于交叉熵的社区发现算法[J].计算机学报,2015,38(8):1574-1581. 被引量：16

二级参考文献161

1鲁明羽,沈抖,郭崇慧,陆玉昌.面向网页分类的网页摘要方法[J].电子学报,2006,34(8):1475-1480. 被引量：5
2CNN Facebook nearly as large as U. S. population [OL]. (2009-09 -16)[2011-04-27]. http..//edition, cnn. com/2009/ TECH/09/16/facebook. profit/.
3Raghavan S, Molina G H. Representing Web graphs [C] // Proc of Int Conf on Data Engineering 2003. Piscataway, NJ: IEEE, 2003:405-416.
4Rjeili A A, Karypis G. Multilevel algorithms for partitioning power-law graphs [C] //Proc of Int Parallel and Distributed Processing Symp 2006. Piscataway, NJ: IEEE, 2006: 16- 575.
5Tian Y Y, Hankins R A, Patel M J. Effcient aggregation for graph summarization [C] //Proc of ACM SIGMOD Int Conf on Management of Data. New York: ACM, 2008 : 567-580.
6Zhang N, Tian Y Y, Patel M J. Discovery-driven graph summarization [C] //Proc of Int Conf on Data Engineering 2010. Piscataway, NJ: IEEE, 2010: 880-891.
7Chakrabarti D, Faloutsos C. Graph mining: Laws, generators, and algorithms [J]. ACM Computing Surveys, 2006, 38(1): article No. 2.
8Newman M E J, The structure and function of complex networks [J]. ACM Sigcsim Installation Management Review, 2003, 45: 167-256.
9Chakrabarti D, Faloutsos C, Zhan Y. Visualization of large networks with min-cut plots, A-plots and R MAT [J]. Int Journal of Man-machine Studies, 2007, 65(5): 434-445.
10Jun H, Wang W, Prins J, et al. Spin: Mining maximal frequent subgraphs from graph databases [C] //Proc of Knowledge Discovery and Data Mining 2004. New York: ACM, 2004:581-586.

共引文献97

1张杰鑫,庞建民,张铮.拟态构造的Web服务器异构性量化方法[J].软件学报,2020,31(2):564-577. 被引量：11
2熊涛,何跃.微博转发网络中意见领袖的识别与分析[J].现代图书情报技术,2013(6):55-62. 被引量：34
3陈德华,周蒙,孙延青,郑亮亮.MR-GSpar:一种基于MapReduce的大图稀疏化算法[J].计算机科学,2013,40(10):190-193. 被引量：5
4杨海陆,张健沛,杨静.基于结构冗余性校准的在线式社会网络压缩[J].计算机研究与发展,2013,50(12):2504-2519. 被引量：2
5李泓波,张健沛,杨静,白劲波,初妍.基于拓扑势的重叠社区及社区间结构洞识别——兼论结构洞理论视角下网络的脆弱性[J].电子学报,2014,42(1):62-69. 被引量：8
6刘胜宗,廖志芳,胡佳,樊晓平.基于隐反馈的类时齐 Markov 推荐模型[J].电子学报,2014,42(4):703-710. 被引量：1
7吕品,钟珞,唐琨皓.在线产品评论用户满意度综合评价研究[J].电子学报,2014,42(4):740-746. 被引量：17
8苏雪阳,左万利,王俊华.基于本体与模式的网络用户兴趣挖掘[J].电子学报,2014,42(8):1556-1563. 被引量：6
9潘秋萍,游进国,张志朋,董朋志,胡宝丽.图聚集技术的现状与挑战[J].软件学报,2015,26(1):167-177. 被引量：6
10王珉,王永滨.网络音乐标签效用度和稳定性研究[J].计算机科学与探索,2015,9(5):535-545. 被引量：2

同被引文献24

1赵卓翔,王轶彤,田家堂,周泽学.社会网络中基于标签传播的社区发现新算法[J].计算机研究与发展,2011,48(S3):8-15. 被引量：37
2程学旗,沈华伟.复杂网络的社区结构[J].复杂系统与复杂性科学,2011,8(1):57-70. 被引量：69
3林旺群,卢风顺,丁兆云,吴泉源,周斌,贾焰.基于带权图的层次化社区并行计算方法[J].软件学报,2012,23(6):1517-1530. 被引量：21
4王元卓,靳小龙,程学旗.网络大数据:现状与展望[J].计算机学报,2013,36(6):1125-1138. 被引量：714
5闫光辉,舒昕,马志程,李祥.基于主题和链接分析的微博社区发现算法[J].计算机应用研究,2013,30(7):1953-1957. 被引量：28
6朱牧,孟凡荣,周勇.基于链接密度聚类的重叠社区发现算法[J].计算机研究与发展,2013,50(12):2520-2530. 被引量：34
7HE Li,JIA Yan,HAN Weihong,DING Zhaoyun.Mining User Interest in Microblogs with a User-Topic Model[J].China Communications,2014,11(8):131-144. 被引量：17
8任磊,杜一,马帅,张小龙,戴国忠.大数据可视分析综述[J].软件学报,2014,25(9):1909-1936. 被引量：419
9孙怡帆,李赛.基于相似度的微博社交网络的社区发现方法[J].计算机研究与发展,2014,51(12):2797-2807. 被引量：24
10孙鹤立,黄健斌,田勇强,宋擒豹,刘怀亮.Detecting overlapping communities in networks via dominant label propagation[J].Chinese Physics B,2015,24(1):551-559. 被引量：11

引证文献7

1陈晶,万云.基于相似度的双向合并社区发现算法研究[J].小型微型计算机系统,2018,39(7):1487-1491. 被引量：1
2马慧芳,陈海波,赵卫中,邴睿,黄乐乐.融合标签平均划分距离和结构关系的微博用户可重叠社区发现[J].电子学报,2018,46(11):2612-2618. 被引量：8
3李政廉,吉立新,黄瑞阳,兰巨龙.面向大规模网络的快速重叠社团挖掘算法[J].电子学报,2019,47(2):257-265. 被引量：3
4王高飞,张月琴,陈健.内容相似度微博社区发现方法研究[J].太原理工大学学报,2019,50(3):374-379.
5潘剑飞,曹燕,董一鸿,陈华辉,钱江波.基于Attention深度随机森林的社区演化事件预测[J].电子学报,2019,47(10):2050-2060. 被引量：5
6王龙.一种适用于社交网络分析的分层社区检测算法[J].信息与电脑,2019,31(24):17-19.
7李柯宇,程秀芳,潘宇,程树林.基于语义相似度和标签预分配的重叠社区发现方法[J].现代计算机,2024,30(14):18-25.

二级引证文献17

1刘海姣,马慧芳,昌阳,李志欣.基于熵加权属性子空间的目标社区发现[J].中文信息学报,2019,33(8):111-120. 被引量：3
2高颀.基于“Effect-theme”共现网络的专利分类方法[J].信息技术与信息化,2020(4):137-142. 被引量：2
3冯勇,张冰茹,徐红艳,王嵘冰+,张永刚.结合改进差分进化和模块密度的社区发现算法[J].计算机科学与探索,2020,14(6):1070-1080. 被引量：5
4赵琪琪,马慧芳,刘海姣,贾俊杰.融合节点属性与结构信息的子空间异常社区检测方法[J].计算机工程,2020,46(6):94-102. 被引量：1
5WANG Lele,WANG Binqiang,ZHAO Peipei,LIU Ruyi,LIU Jiangang,MIAO Qiguang.Malware Detection Algorithm Based on the Attention Mechanism and ResNet[J].Chinese Journal of Electronics,2020,29(6):1054-1060. 被引量：5
6刘海姣,马慧芳,赵琪琪,李志欣.融合用户兴趣偏好与影响力的目标社区发现[J].计算机研究与发展,2021,58(1):70-82. 被引量：6
7孙全明,曲志坚,任崇广.基于粒子群优化和LightGBM的情景感知多式联运推荐[J].电子学报,2021,49(5):894-903. 被引量：6
8王得翊,焦澳琛,陈音拿,安静,康琦,汪镭.基于多阶局部度数峰值点的局部社区发现算法[J].微型电脑应用,2021,37(6):1-4. 被引量：1
9郭飞鹏,卢琦蓓,孙兆洋.基于均值漂移图聚类的复杂网络社区发现方法[J].通信学报,2021,42(9):231-239. 被引量：1
10张中军,于来行,李润川.基于链路结构和转发行为的微博社交网络重叠社区划分方法[J].郑州大学学报（理学版）,2021,53(4):69-76. 被引量：4

1lcnnome.破解MD5——创想家居设计软件的算法分析[J].黑客防线,2006(6):120-123.
2梅瞳瞳,徐林琳.一种基于SNMP的网络拓扑发现策略[J].计算机光盘软件与应用,2011(13):122-122.
3周启海.计算机结构程序设计原理与应用系列讲座：第八讲自顶向下结构设计技术与方法[J].电子与电脑,1990(8):34-35.
4朱子江,刘寿强.基于用户标签的推荐系统研究[J].现代计算机,2017,23(5):7-10.
5陈思洲,朱健,乔艳涛.无线局域网的安全性分析和研究[J].电子工程师,2005,31(9):48-50.
6赵建华,刘宁.结合主动学习和半监督学习的网络入侵检测算法[J].西华大学学报（自然科学版）,2015,34(6):53-57. 被引量：5
7郑国樑,郑毅.支持自顶向下程序设计的工具—CTOOL[J].计算机应用,1990,10(4):17-22.
8陈建杰,叶智宣.多分类SVM主动学习及其在遥感图像分类中的应用[J].测绘科学,2009,34(4):97-100. 被引量：8
9向阳,李腊元,程传慧.移动Ad Hoc多播路由协议研究[J].武汉理工大学学报（交通科学与工程版）,2005,29(6):840-843. 被引量：2
10王建新,荣亮,肖雪峰.几种主动队列管理算法的仿真及性能评估[J].计算机工程,2007,33(3):128-130. 被引量：3

电子学报

2017年第4期

浏览历史

内容加载中请稍等...

基于核心标签的可重叠微博网络社区划分方法被引量：7

参考文献9

二级参考文献161

共引文献97

同被引文献24

引证文献7

二级引证文献17

相关作者

相关机构

相关主题

浏览历史

基于核心标签的可重叠微博网络社区划分方法 被引量：7

参考文献9

二级参考文献161

共引文献97

同被引文献24

引证文献7

二级引证文献17

相关作者

相关机构

相关主题

浏览历史

基于核心标签的可重叠微博网络社区划分方法被引量：7