虚假内容检测,谣言检测,不实信息检测,事实核查;纯文本,多模态,多语言;数据集整理

本博客系博主个人理解和整理所得,包含内容无法详尽,如有补充,欢迎讨论。

这里只提供数据集相关介绍和来源出处,或者下载地址等,因版权原因不提供数据集所含的元数据。如有需要,请自行下载。

“Complete dataset cannot be distributed because of Twitter privacy policies and news publisher copy rights. Social engagements and user information are not disclosed because of Twitter Policy.”

0. 一些数据集合集及相关综述:

Fake News Detection | Papers With Code

GitHub - ICTMCG/fake-news-detection: This repo is a collection of AWESOME things about fake news detection, including papers, code, etc.

论文:Combating Fake News: A Survey on Identification and Mitigation Techniques

论文:TACL2022 A Survey on Automated Fact-Checking

论文:Fake news detection: A hybrid CNN-RNN based deep learning approach

论文:The Surprising Performance of Simple Baselines for Misinformation Detection,该论文的github项目地址GitHub - ComplexData-MILA/misinfo-baselines有本文实验所用的数据集。

一、多模态数据集

1. ExFaux数据集 [23], 2020年;

  • 包含263张image和若干text;有social metadata和comments;
  • 英文,来自Twitter和Reddit。
  • 本文的任务除了判断一个post的真假之外,还需要判断是多模态内容中的image or claim导致的虚假(这个是别的方法没有考虑过的,也因为数据集没有提供这个标签);
  • 论文中没有提供数据集的下载地址和源码,从网上也没有搜索到;

2. FauxBuster数据集 [24],2018年;

  • 包含917个image及text;
  • 有social metadata和comments;
  • 英文,来自Twitter和Reddit网站。

3. MR2数据集 [25];

  • 包含14700个image及text,类别是rumor,non-rumor,unverified;
  • 有social metadata和comments,还有从网站上检索的text和image证据;
  • 中文来自weibo,英文来自Twitter。
  • 数据集下载地址(在谷歌云上,weibo有24G,twitter 有22G):GitHub - THU-BPM/MR2

4. MuMiN数据集 [26],2022年;

  • 包含984张image和text,有social metadata和comments,可以构成tweet之间的graph;
  • 很多语言,来自Twitter;
  • 因为来自twitter,根据twitter的规则,作者只提供了可以用来从twitter下载所有数据的爬虫代码,没有提供数据文件。数据需要大家自行下载。数据集下载地址:MuMiN - A Large-Scale Multilingual Multimodal Fact-Checked Misinformation Social Network Dataset

5. Weibo数据集 [27](来自att-RNN)

  • 包含9528张image和text;
  • 有social metadata(是字段型的social info,比如转发数,用户名,用户的发推数目等),没有retweet和comments;
  • 中文,来自Weibo;

6. COSMOS数据集 [36]

  • 包含image和text,是为了检测out-of-context,也就是图文不符的情况。Training (160 K images), Validation (40 K images) and Test (1700 images)。
  • 没有social info;
  • 每一张图片还给出了最多10个bounding box;
  • 数据集地址:https://github.com/shivangi-aneja/COSMOS
  • 需要先填一个表格,然后作者会给数据集的下载方式。数据集主页:COSMOS Dataset — COSMOS: Catching Out-of-Context Misinformation using Self-Supervised Learning 1.0 documentation

7. MM-COVID 数据集[37];

  • 包含image,text,social info等内容,covid-19相关;
  • 3981个虚假内容和 7192 个真实内容,包含 English, Spanish, Portuguese, Hindi, French and Italian, 6 种不同语言;
  • 数据集地址:https://github.com/bigheiniu/MM-COVID
  • 还有一个地址:GitHub - bigheiniu/MM-COVID: Cross Linugual COVID-19 Fake News Dataset
  • 上述地址中只提供了news和相关tweet的id(在谷歌云上)。因为来自twitter,所以数据集中只提供了tweet的id,而tweet的text内容需要大家自行下载,数据集中提供了下载的代码。

 8. FakeNewsNet [9] 数据集;

  • 包含两部分:GossipCop,PolitiFact;是否包含BuzzFeed?
  • 下载地址如下。作者提供了爬虫代码,可以直接运行得到所需的数据。需要twitter API:

https://github.com/KaiDMML/FakeNewsNet

  • 下面也是[9]官方提出的数据集,但是数据集变成了BuzzFeed+PolitiFact,不知道为什么。这个数据集可以直接下载。

FakeNewsNet | Kaggle

  • 下面是一个修改后的下载该数据集的项目,能够以更快的速度从twitter上下载tweets:

GitHub - SaschaStenger/FakeNewsNet_modified

  • 下面这个论文的作者似乎能分享这个数据集的tweet和user元数据。给下面的作者发邮件,能得到谷歌云上的数据:

GitHub - hwang219/AttackFakeNews

  • 使用该数据集的论文:[7],SAFE,icassp的知识蒸馏论文,spotfake or plus?,

9.Fakeddit数据集 [21],

  • 有images;

  • 数据集的下载地址:

GitHub - entitize/Fakeddit: r/Fakeddit New Multimodal Benchmark Dataset for Fine-grained Fake News Detection

GitHub - faiazrahman/Multimodal-Fake-News-Detection: Multi-Modal Fine-Grained Fake News Detection with Dialogue Summarization

10.PHEME数据集[15];

  • 这个数据集包含twitter完整的post信息,包含pic_url项,可以自己去爬对应的images。但是很多post该项为空。
  • 有个人[18]爬了这个数据集的images:GitHub - drivsaf/MFAN
  • 使用该数据集的文章:ICMR-2020-KMGCN, [18], HMCAN;

11. ReCOVery数据集 [38];

  • 包含text,image,时间信息,传播信息(textual, visual, temporal, and network information);
  • 用了三个关键词检索相关article:SARS-CoV-2,COVID-19, Coronavirus;
  • 爬取每一个news的News Content,具体包括12个:Id,URL,发布者,发布时间,作者,标题和正文,图片,国家,政治偏向,真假情况NewsGuard score and MBFC factual reporting;
  • 同时,作者还爬取了news在tweet上的传播情况,包括许多详细信息:the corresponding tweets with detailed information such as their IDs, text, languages of text, times of being created, statistics on retweeted/replied/liked。但是由于twitter的内容限制,数据集中没有提供这些tweet的信息,只提供了相关的tweet id,需要大家自行下载。下载的指导在数据集中有。To comply with Twitter’s Terms of Service, we only publicly release the IDs of the collected data for non-commercial research use, but provide the instructions for obtaining the tweets using the released IDs for user convenience.
  • 数据集下载地址:http://coronavirus-fakenews.com
  • 作者在上述地址中提供了news的url,正文text,image-url(没有image文件)。但是network信息只提供了tweet id,需要自己爬tweet的内容。(这个image和tweet都需要别人帮忙爬)
  • 上面那个地址可能打不开,还有一个:GitHub - apurvamulay/ReCOVery: A Multimodal Repository for COVID-19 News Credibility Research

12.CHECKED数据集,来自 [39];

  • 包含text,image,还有comment,repost等social info;
  • 中文,来自weibo,关于covid-19的数据集;
  • 这个数据集的地址:

https://github.com/cyang03/CHECKED

  • 上面的地址中的数据集提供了所有数据的json文件,有comments和reposts(这些都有id,不知道能不能构成graph)。这些东西的text文本都有。其中包含 pic_url 和 video_url,而没有image文件。需要大家自己根据image url去下载image和video。

二、纯文本数据集

1. CW-CURE 数据集

  • 来自[30],包含3266条claim text,医疗领域的;
  • 只有text,没有social info,没有image。
  • 英文,来自Twitter;

2. BioClaims 数据集

  • 来自[31],related to COVID-19, measles, cystic fibrosis, and depression;
  • 好像只有text?
  • 英文,来自Twitter

4. LIAR [22] 数据集;

数据来源是从politifact网站上爬的;

 数据集下载地址:

https://www.cs.ucsb.edu/~william/data/liar_dataset.zip

5. 又一个weibo数据集 [19],在[16]的基础上,数据量增加了一倍。

  • 该文章的代码:

GitHub - thunlp/CED: source code for TKDE paper “CED: Credible Early Detection of Social Media Rumors”

  • 该数据集所在地址及规模大小:

GitHub - thunlp/Chinese_Rumor_Dataset: 中文谣言数据

  •  使用该数据集的文章有:[18];

6. CoAID 数据集 [8]:

  • 包含 5,216 条新闻, 296,752 related user engagements, 958 social platform posts about COVID-19, and ground truth labels.
  • 数据集地址如下:
  • GitHub - cuilimeng/CoAID
  • 但是github项目里面只给了news的https,以及跟news相关的tweet的id,以及retweet的id。所以数据其实还需要自己爬。而且github中没有提供爬虫代码。(这个需要别人帮忙)
  • 有个论文说这个数据集包含image,应该是在爬取tweet内容的时候可以把其image也一起爬了。但是本数据集在提出的时候并没有处理image。
  • 使用该数据集的论文:[7]

7. MC-Fake 数据集[40];

  • 纯文本信息,针对news有 tweets, retweets, replies, retweet relations, and replying relations,可以构建post的propagation network;
  • 27,155 news events, 5 million posts, 2 million users and an induced user social graph with 0.2 billion edges.
  • 数据集中有五种主题: five topics: Politics, Entertainment, Health, Covid-19 and Syria War,
  • 来自Twitter,又没有内容,需要自己爬,诶,人生怎么这么艰难;

 8. 又有名字一样的,Weibo和Twitter数据集,来自[16];

  • 下面是原始论文提供的地址,失效了:

http://alt.qcri.org/⇠wgao/data/rumdect.zip

  • 新的数据集下载地址如下:

https://www.dropbox.com/s/46r50ctrfa0ur1o/rumdect.zip?dl=0

  • 推特数据集没有提供content,因为twitter的版权问题,只能自己根据id用Twitter API去爬。
  • weibo提供了post的详细content。但是本数据集没有提供source images,虽然content里面有post附带的picture的url信息,而且大部分post的picture项为null。

  • 该数据集规模大小:下面的图片来自[19].

  •  使用该数据集的文章:[19], [2];

三、事实核查数据集

1. FEVEROUS数据集 [28];

  • 包含需要验证的claim,证据是wikipedia上的pages中的sentence或者tables(其他数据集很少有用tables的);
  • 数据集下载地址:https://fever.ai/dataset/feverous.html

2. CHEF数据集 [29],NAACL 2022年;

  • 中文;
  • 包含完整的text内容,和对应的social metadata,(e.g. author, domain, URL publication date).
  • 数据集下载地址:https://github.com/THU-BPM/CHEF

3. MultiFC数据集 [32], EMNLP 2019年;

  • 有36534条claim,textual sources and rich metadata, and labelled for veracity by human expert journalists. 但是metadata如上图,是独立特征的,不是retweet;
  • 英文,爬取的数据来自26个事实核查网站,非人工创造的claim;
  • multi指的是claim来自多个domain,e.g., politics, sports, and entertainment。而不是多模态。

4.FEVER 数据集 [1];

dataset seeks to retrieve supporting evidence for single-sentence claims and classify the
claims as Supported, Refuted or NotEnoughInfo.

使用该数据集的论文:

三、其他(还在分析和整理中,没有分类)

1. 又一个PHEME [33],

2.PolitiFact5 is a website that manually assigns factcheck label to claims, along with the background information.

PolitiFact

使用该数据集的论文:[7]

3.Zlatkova et al. (2019) propose a dataset for fact-checking claims about images [3].

4.TabFact (Chen et al., 2019) presents semi-structural tables for fact verification [4].

5.The SemEval-2020 shared task (Da San Martino et al., 2020) centers on the detection of propaganda techniques in news articles, which is more linguistically oriented [5].

6.infosurgeon [6]通过修改news的KG或者ARM graph生成的虚假新闻:

7. Constraint 数据集[34];

跟covid-19有关的数据;

9.All-in-one: Multi-task Learning for Rumour Verifification.

10. 文章[20]提出了两个数据集Snopes和Politifact,有images。

we split the full dataset into two sub datasets called Snopes and Politifact datasets. The former one contains pairs where FC-articles are from snopes.com and the later one contains pairs where FC-articles are from politifact.com.

这是该文章的code和dataset地址(还没下载,因为在google云上):

https://github.com/nguyenvo09/EMNLP2020

11.ANTiVax 数据集[35];

跟covid-19有关,来自twitter;

12. FakeNews AMT [12]提出了该数据集

使用该数据集的论文:[10] [11]

13. Celeb [12]提出了该数据集

使用该数据集的论文:[10] [11]

14 PHEME 9 出自[13]

使用该数据集的论文:[10]

16.Sentimental-LIAR [14]提出的,对LIAR添加了情感信息和emotions。

21.又一个twitter数据集来自[17]:

https://www.dropbox.com/s/7ewzdrbelpmrnxu/rumdetect2017.zip?dl=0

由于twitter的限制,该数据集只提供了source tweet ID 及 source tweet content,还有传播树结构。
其他post相关内容需要自己根据id去爬。

这个好像就是text研究中用的很多的twitter15和twitter16,没有image内容。

参考文献:

[1] James Thorne, Andreas Vlachos, Christos Christodoulopoulos, and Arpit Mittal. 2018.
Fever: a large-scale dataset for fact extraction and verification. In Proceedings of the 2018 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, pages 809–819.

[2] F. Yu, Q. Liu, S. Wu, L. Wang, and T. Tan, “A convolutional approach for misinformation identification,” in Proceedings of IJCAI, 2017.

[3] Dimitrina Zlatkova, Preslav Nakov, and Ivan Koychev. 2019. Fact-checking meets fauxtography: Verifying claims about images. In Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing (EMNLP-IJCNLP), pages 2099–2108, Hong Kong, China. Association for Computational Linguistics.

[4] Wenhu Chen, Hongmin Wang, Jianshu Chen, Yunkai Zhang, Hong Wang, Shiyang Li, Xiyou Zhou, and William Yang Wang. 2019. Tabfact: A largescale dataset for table-based fact verification. arXiv preprint arXiv:1909.02164.

[5] Giovanni Da San Martino, Alberto Barron-Cedeno, ´Henning Wachsmuth, Rostislav Petrov, and Preslav Nakov. 2020. Semeval-2020 task 11: Detection of ropaganda techniques in news articles. In Proceedings of the Fourteenth Workshop on Semantic Evaluation, pages 1377–1414.

[6] InfoSurgeon: Cross-Media Fine-grained Information Consistency Checking for Fake News Detection

[7] Embracing Domain Differences in Fake News: Cross-domain Fake News Detection

using Multimodal Data,AAAI 2021.

[8] Limeng Cui and Dongwon Lee. 2020. CoAID: Covid-19 healthcare misinformation dataset. arXiv preprint arXiv:2006.00885

[9] Kai Shu, Deepak Mahudeswaran, Suhang Wang, Dongwon Lee, and Huan Liu. 2020a. Fakenewsnet: A data repository with news content, social context, and spatiotemporal information for studying fake news on social media. Big data, 8(3):171–188.

[10] An Emotion-Based Multi-Task Approach to Fake News Detection (Student Abstract)

[11] Saikh, T.; De, A.; Ekbal, A.; and Bhattacharyya, P. 2020. A Deep Learning Approach for Automatic Detection of Fake News. arXiv:2005.04938.

[12] Perez-Rosas, V.; Kleinberg, B.; Lefevre, A.; and Mihalcea, R. ´ 2018. Automatic Detection of Fake News. In Proceedings of the 27th International Conference on Computational Linguistics,
3391–3401. Santa Fe, New Mexico, USA: ACL.

[13] Zubiaga, A.; Liakata, M.; and Procter, R. 2016. Learning Reporting Dynamics during Breaking News for Rumour Detection in Social Media. arXiv:1610.07363.

[14] Upadhayay, B.; and Behzadan, V. 2020. Sentimental LIAR: Extended Corpus and Deep Learning Models for Fake Claim Classification. In 2020 IEEE International Conference on
Intelligence and Security Informatics (ISI), 1–6. IEEE.

[15] Arkaitz Zubiaga, Maria Liakata, and Rob Procter. 2017. Exploiting context for rumour detection in social media. In International Conference on Social Informatics. Springer, 109–123.

[16] Jing Ma, Wei Gao, Prasenjit Mitra, Sejeong Kwon, Bernard J Jansen, Kam-Fai Wong, and Meeyoung Cha. Detecting rumors from microblogs with recurrent neural networks. In Proceedings of IJCAI 2016.

[17] Jing Ma, Wei Gao, Kam-Fai Wong. Detect Rumors in Microblog Posts Using Propagation Structure via Kernel Learning. ACL 2017.

[18] IJCAI 2022, MFAN: Multi-modal Feature-enhanced Attention Networks for Rumor Detection;

[19] Changhe Song, Cheng Yang, Huimin Chen, Cunchao Tu, Zhiyuan Liu, and Maosong Sun.
Ced: Credible early detection of social media rumors. IEEE Transactions on Knowledge and Data Engineering, 33(8):3035–3047, 2019

[20] Nguyen Vo and Kyumin Lee. 2020. Where Are the Facts? Searching for Fact-checked Information to Alleviate the Spread of Fake News. In Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing (EMNLP), pages 7717–7731, Online. Association for Computational Linguistics.

[21] Kai Nakamura, Sharon Levy, and William Yang Wang. 2020. Fakeddit: A New Multimodal Benchmark Dataset for Fine-grained Fake News Detection. In Proceedings of the Twelfth Language Resources and Evaluation Conference, pages 6149–6157, Marseille, France. European Language Resources Association.

[22] ACL 2017,“Liar, Liar Pants on Fire”: A New Benchmark Dataset for Fake News Detection

[23] Ziyi Kou, Daniel Yue Zhang, Lanyu Shang, and Dong Wang. 2020. ExFaux: A Weakly Supervised Approach to Explainable Fauxtography Detection. In 2020 IEEE International Conference on Big Data (IEEE BigData 2020), Atlanta, GA, USA, December 10-13, 2020, Xintao Wu, Chris Jermaine, Li Xiong, Xiaohua Hu, Olivera Kotevska, Siyuan Lu, Weija Xu, Srinivas Aluru, Chengxiang Zhai, Eyhab AlMasri, Zhiyuan Chen, and Jeff Saltz (Eds.). IEEE, 631–636. https://doi.org/10. 1109/BigData50022.2020.9378019

[24] Daniel Yue Zhang, Lanyu Shang, Biao Geng, Shuyue Lai, Ke Li, Hongmin Zhu, Md. Tanvir Al Amin, and Dong Wang. 2018. FauxBuster: A Content-free Fauxtography Detector Using Social Media Comments. In IEEE International Conference on Big Data, Big Data 2018, Seattle, WA, USA, December 10-13, 2018, Naoki Abe, Huan Liu, Calton Pu, Xiaohua Hu, Nesreen K. Ahmed, Mu Qiao, Yang Song, Donald Kossmann, Bing Liu, Kisung Lee, Jiliang Tang, Jingrui He, and Jeffrey S. Saltz (Eds.). IEEE, 891–900. https://doi.org/10.1109/BigData.2018.8622344

[25] SIGIR 2023, MR2: A Benchmark for Multimodal Retrieval-Augmented Rumor Detection in Social Media

[26] Dan Saattrup Nielsen and Ryan McConville. 2022. MuMiN: A Large-Scale Multilingual Multimodal Fact-Checked Misinformation Social Network Dataset. In SIGIR ’22: The 45th International ACM SIGIR Conference on Research and Development in Information Retrieval, Madrid, Spain, July 11 - 15, 2022, Enrique Amigó, Pablo Castells, Julio Gonzalo, Ben Carterette, J. Shane Culpepper, and Gabriella Kazai (Eds.). ACM, 3141–3153. https://doi.org/10.1145/3477495.3531744

[27] Zhiwei Jin, Juan Cao, Han Guo, Yongdong Zhang, and Jiebo Luo. 2017. Multimodal fusion with recurrent neural networks for rumor detection on microblogs. In Proceedings of the 25th ACM international conference on Multimedia. 795–816

[28] Rami Aly, Zhijiang Guo, Michael Sejr Schlichtkrull, James Thorne, Andreas Vlachos, Christos Christodoulopoulos, Oana Cocarascu, and Arpit Mittal. 2021. FEVEROUS: Fact Extraction and VERification Over Unstructured and Structured information. In Proceedings of the Neural Information Processing Systems Track on Datasets and Benchmarks 1, NeurIPS Datasets and Benchmarks 2021, December 2021, virtual, Joaquin Vanschoren and Sai-Kit Yeung (Eds.). https://datasets-benchmarks-proceedings.neurips.cc/paper/2021/hash/
68d30a9594728bc39aa24be94b319d21-Abstract-round1.html

[29] Xuming Hu, Zhijiang Guo, Guanyu Wu, Aiwei Liu, Lijie Wen, and Philip S. Yu. 2022. CHEF: A Pilot Chinese Dataset for Evidence-Based Fact-Checking. In Proceedings of the 2022 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, NAACL 2022, Seattle, WA, United States, July 10-15, 2022, Marine Carpuat, Marie-Catherine de Marneffe, and Iván Vladimir Meza Ruíz (Eds.). Association for Computational Linguistics, 3362–3376. https://doi.org/10.18653/v1/2022.naacl-main.246

[30] Identifying Checkworthy CURE Claims on Twiter, www 2023;

[31] Amelie Wührl and Roman Klinger. 2021. Claim Detection in Biomedical Twitter Posts. In Proceedings of the 20th Workshop on Biomedical Language Processing. 131–142.

[32] MultiFC: A Real-World Multi-Domain Dataset for Evidence-Based Fact Checking of Claims, EMNLP 2019,

[33] Cody Buntain and Jennifer Golbeck. 2017. Automatically identifying fake news in popular twitter threads.In 2017 IEEE International Conference on Smart Cloud (SmartCloud), pages 208–215. IEEE.

[34] Parth Patwa, Shivam Sharma, Srinivas Pykl, Vineeth Guptha, Gitanjali Kumari, Md Shad Akhtar, Asif Ekbal, Amitava Das, and Tanmoy Chakraborty. 2021. Fighting an infodemic: Covid-19 fake news dataset. In International Workshop on Combating Online Hostile Posts in Regional Languages during Emergency Situation, pages 21–29. Springer.

[35] Kadhim Hayawi, Sakib Shahriar, Mohamed Adel Serhani, Ikbal Taleb, and Sujith Samuel Mathew. 2022. Anti-vax: a novel twitter dataset for covid-19 vaccine misinformation detection. Public health, 203:23–30.

[36] COSMOS: Catching Out-of-Context Misinformation with Self-Supervised Learning,

[37] Yichuan Li, Bohan Jiang, Kai Shu, and Huan Liu. 2020. MM-COVID: A Multilingual and Multidimensional Data Repository for CombatingCOVID-19 Fake New. arXiv e-prints (2020), arXiv–2011.

[38] X. Zhou, A. Mulay, E. Ferrara, and R. Zafarani, “Recovery: A multimodal repository for covid-19 news credibility research,” 2020.

[39] Social Network Analysis and Mining (2021), CHECKED: Chinese COVID‑19 fake news dataset;

[40] Erxue Min, Yu Rong, Yatao Bian, Tingyang Xu, Peilin Zhao, Junzhou Huang, and Sophia Ananiadou. 2022. Divide-and-Conquer: Post-User Interaction Network for Fake News Detection on Social Media. In Proceedings of the ACM Web Conference 2022 (Virtual Event, Lyon, France) (WWW ’22). Association for Computing Machinery, New York, NY, USA, 1148–1158. https://doi.org/10.1145/3485447.3512163

总结:

博主目前暂时收集和整理了这些数据集,“其他”类别中的数据集还没有进行详细分析,同时还有许多不完善的地方。

如有补充或者错漏敬请大家在评论区指正。

会持续更新,对数据集进行详细介绍,提供相应的数据集下载地址。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/139410.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

深度学习之基于Django+Tensorflow商品识别管理系统

欢迎大家点赞、收藏、关注、评论啦 ,由于篇幅有限,只展示了部分核心代码。 文章目录 一项目简介 二、功能三、系统四. 总结 一项目简介 项目简介 本系统是一个基于DjangoTensorflow的商品识别管理系统。通过深度学习技术,实现商品的自动识别…

arduino 简易智能花盆

编辑器:arduino IDE 主板:arduino uno 传感器: 0.96寸的OLED屏(四脚) 声音模块 土壤温湿度模块 DS18B20温度模块(这里用到防水的) 光敏电阻模块(买成三脚的了只能显示高低&#x…

el-table实现展开当前行时收起上一行的功能

<el-tableref"tableRef":data"tableData":expand-row-keys"expandRowKeys":row-key"handleRowKey" // 必须指定 row-keyexpand-change"handleExpandChange" // 当用户对某一行展开或者关闭的时候会触发该事件> <…

【算法专题】双指针—三数之和

力扣题目链接&#xff1a;三数之和 一、题目解析 二、算法原理 解法一&#xff1a;排序暴力枚举利用set去重 代码就不写了&#xff0c;你们可以试着写一下 解法二&#xff1a;排序双指针 这题和上一篇文章的两数字和方法类似 排序固定一个数a在这个数的后面区间&#xff0…

《詩經别解》——國風·周南·雎鳩​​​​​​​

一、关于古文的一个认识 目前可以阅读的古文经典&#xff0c;大多是经历了几千年的传承。期间的武力战争、文化纷争、宗教侵袭、官僚介入及文人的私人恩怨与流派桎梏&#xff0c;印刷与制作技术&#xff0c;导致这些古文全部都已经面目全非。简单地说&#xff0c;你读到的都是…

2022最新版-李宏毅机器学习深度学习课程-P46 自监督学习Self-supervised Learning(BERT)

一、概述&#xff1a;自监督学习模型与芝麻街 参数量 ELMO&#xff1a;94MBERT&#xff1a;340MGPT-2&#xff1a;1542MMegatron&#xff1a;8BT5&#xff1a;11BTuring NLG&#xff1a;17BGPT-3&#xff1a;175BSwitch Transformer&#xff1a;1.6T 二、Self-supervised Lear…

[HXPCTF 2021]includer‘s revenge

文章目录 方法一前置知识Nginx 在后端 Fastcgi 响应过大产生临时文件竞争包含绕过include_once限制 解题过程 方法二前置知识Base64 Filter 宽松解析iconv filter 解题过程 方法一 NginxFastCGI临时文件 前置知识 Nginx 在后端 Fastcgi 响应过大产生临时文件 www-data用户在n…

SharePoint 页面中插入自定义代码

我们都知道 SharePoint 是对页面进行编辑的。 对于一些有编程基础的人来说&#xff0c;可能需要对页面中插入代码&#xff0c;这样才能更好的对页面进行配置。 但是在新版本的 SharePoint modern 页面来说&#xff0c;虽然我们可以插入 Embed 组件。 但是 Embed 组件中是不允…

【C++基础 】类和对象(上)

C基础 类和对象&#xff08;上&#xff09; 1.面向过程和面向对象初步认识2.类的引入3.类的定义4.类的访问限定符及封装4.1 访问限定符4.2 封装 5.类的作用域6.类的实例化7.类对象模型7.1 如何计算类对象的大小7.2 类对象的存储方式猜测7.3 结构体内存对齐规则 8.this指针8.1 t…

Kubernetes实战(四)-部署docker harbor私有仓库

1 Docker原生私有仓库Registry 1.1 原生私有仓库Registry概述 Docker的仓库主要分两类&#xff1a; 私有仓库公有仓库 共有仓库只要在官方注册用户&#xff0c;登录即可使用。但对于仓库的使用&#xff0c;企业还是会有自己的专属镜像&#xff0c;所以私有库的搭建也是很有…

分享vmware和Oracle VM VirtualBox虚拟机的区别,简述哪一个更适合我?

VMware和Oracle VM VirtualBox虚拟机的区别主要体现在以下几个方面&#xff1a; 首先两种软件的安装使用教程如下&#xff1a; 1&#xff1a;VMware ESXI 安装使用教程 2&#xff1a;Oracle VM VirtualBox安装使用教程 商业模式&#xff1a;VMware是一家商业公司&#xff0c;而…

HTTP和HTTPS详解

一)什么是HTTP协议 1)HTTP协议是倾向于相遇业务层次上面的一种协议&#xff0c;传输层协议主要考虑的是端对端之间的一个传输过程&#xff0c;TCP重点进行关注的是可靠传输&#xff1b;咱们的HTTP/1&#xff0c;HTTP/2是基于TCP的&#xff0c;但是咱们的HTTP/3是基于UDP的&…

uniapp H5预览PDF支持手势缩放、分页、添加水印、懒加载、PDF下载

效果预览 项目说明 uniapp vue2 node&#xff1a;v14.18.3 npm&#xff1a; 6.14.15 安装pdfh5.js插件 pdfh5 - npm (npmjs.com)pdfh5.js 基于pdf.js和jQuery pdfh5 - npm (npmjs.com) npm install pdfh5 由于我安装最新的pdfh5.js后运行时报错 所以我选择降低版本,可能是node…

Wireshark学习 与 TCP/IP协议分析

Wireshark简介和工具应用 如何开始抓包&#xff1f; 打开wireshark&#xff0c;显示如下网络连接。选择你正在使用的&#xff0c;&#xff08;比如我正在使用无线网上网&#xff09;&#xff0c;双击 可以先看下自己的ip地址和网关ip地址&#xff08;看抓包数据时候会用到&…

索尼RSV文件怎么恢复为MP4视频

索尼相机RSV是什么文件&#xff1f; 如果您的相机是索尼SONY A7S3&#xff0c;A7M4&#xff0c;FX3&#xff0c;FX3&#xff0c;FX6&#xff0c;或FX9等&#xff0c;有时录像会产生一个RSV文件&#xff0c;而没有MP4视频文件。RSV其实是MP4的前期文件&#xff0c;经我对RSV文件…

[Android]_[初级]_[配置gradle的环境变量设置安装位置]

场景 在开发Android项目的时候, gradle是官方指定的构建工具。不同项目通过wrapper指定不同版本的gradle。随着项目越来越多&#xff0c;使用的gradle版本也增多&#xff0c;导致它以来的各种库也增加&#xff0c;系统盘空间不足&#xff0c;怎么解决&#xff1f; 说明 grad…

C/C++调试工具 - gdb详解

C/C调试工具 -gdb详解 1 简介 2 常用的命令 3 使用的条件 4 程序调试 4.1 直接运行程序 4.2 断点调试(在某一行) 4.3 断点调试(在函数入口处打断点) 5 调试core文件 5.1 生成core文件的方法 5.2 调试core文件 1 简介 GDB是Linux下非常好用且强大的调试工具。GD…

一种ADC采样算法,中位值平均滤波+递推平均滤波

前言 在实际AD采集场景中&#xff0c;会出现周期性变化和偶然脉冲波动干扰对AD采集的影响 这里使用中位值平均滤波递推平均滤波的结合 参考前人写好的代码框架&#xff0c;也参考博主GuYH_下面这篇博客&#xff0c;在此基础上稍作修改&#xff0c;写出这篇博客&#xff0c;能…

NZ系列工具NZ06:VBA创建PDF文件说明

我的教程一共九套及VBA汉英手册一部&#xff0c;分为初级、中级、高级三大部分。是对VBA的系统讲解&#xff0c;从简单的入门&#xff0c;到数据库&#xff0c;到字典&#xff0c;到高级的网抓及类的应用。大家在学习的过程中可能会存在困惑&#xff0c;这么多知识点该如何组织…

【腾讯云 HAI域探秘】探索AI绘画之路:利用腾讯云HAI服务打造智能画家

目录 前言1 使用HAI服务作画的步骤1.1 注册腾讯云账户1.2 创建算力服务器1.3 进入模型管理界面1.4 汉化界面1.5 探索AI绘画 2 模型参数的含义和调整建议2.1 模型参数的含义和示例2.2 模型参数的调整建议 3 调整参数作画的实践和效果3.1 实践说明3.2 实践效果13.3 实践效果23.4 …