找回密码
 立即注册
搜索
查看: 2|回复: 0

10万+微博数据文件打包 可用于自然语言处理任务的数据集

[复制链接]

130

主题

0

回帖

420

积分

管理员

积分
420
发表于 昨天 00:09 | 显示全部楼层 |阅读模式
10万+微博数据文件打包 可用于自然语言处理任务的数据集
十万微博数据集
爬取的103个微博用户截止2019年8月发布的所有原创微博,以csv文件存储,每个用户对应一个csv文件。
包括48位女性,55位男性,男女性分开存储。
包括id、微博正文、微博原始图片URL、原始视频URL、发布日期、发布工具、点赞数、评论数、转发数、话题和@用户。
总共包括十多万条微博,可以用做性别分类等自然语言处理任务的数据集。
10万+微博数据文件打包 可用于自然语言处理任务的数据集
游客,如果您要查看本帖隐藏内容请回复


您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|毕业设计论坛

GMT+8, 2025-11-25 16:20 , Processed in 0.123127 second(s), 18 queries .

快速回复 返回顶部 返回列表