云南开放大学自然语言处理网上作业2

一、多项选择题(共2题,共16分)
第1 题 (8分):
下列属于文本语料的获取方法是( )。
A. 获取网上数据
B. 制定数据搜集策略来搜集数据
C. 第三方语料库
D. 通过购买的方式满足部分需求文本数据
正确答案: ABCD
第2 题 (8分):
4. 下列属于NLTK语料库中可获取的集成文本语料库的是( )
A. 网络聊天文本
B. 布朗语料库
C. 就职演说语料库
D. 路透社语料库
正确答案: ABCD
二、判断题(共7题,共19分)
第3 题 (3分):
1. 语料库的实质是经过科学取样和加工的大规模电子文本库。( )
正确答案: √
第4 题 (3分):
2. 大规模的语料库对于语言研究特别是对NLP研究具有不可替代的作用,但随着语料库的增大,垃圾语料带来的统计垃圾问题也越来越严重。( )
正确答案: √
第5 题 (3分):
3. NLTK是一个用于构建处理自然语言数据的Python应用开源平台。( )
正确答案: √
第6 题 (3分):
4. NLP只能使用传统的机器学习方法来处理。( )
正确答案: ×
第7 题 (3分):
5. 中文语料的处理过程复杂,英文语料的处理过程比较简单。( )
正确答案: √
第8 题 (3分):
6. 元字符使得正则表达式只能匹配字符串集合。( )
正确答案: ×
第9 题 (1分):
7. 语料集合结构包括语料库中语料记录的代码,元数据项、数据类型、数据宽度、取值范围、完整性约束。( )
正确答案: √

内容查看
查看价格5
点点赞赏,手留余香 给TA打赏

评论0

请先
  • 游客 下载了资源 爱普生Epson WorkForce AL-MX200DNF 驱动
  • 游客 下载了资源 2019年下半年教师资格证考试 《高中语文》真题(解析)
  • 游客 下载了资源 爱普生Epson Stylus C87 驱
  • u******* 签到打卡,获得1元奖励
  • u******* 签到打卡,获得1元奖励
  • 游客 下载了资源 佳能Canon PIXMA MX479 驱动
  • u******* 签到打卡,获得1元奖励
  • 游客 下载了资源 2016年河北公务员考试《申论》真题及参考答案
  • u******* 签到打卡,获得1元奖励
  • u******* 签到打卡,获得1元奖励
  • u******* 签到打卡,获得1元奖励
  • 游客 下载了资源 2012年421公务员联考《行测》答案及解析(山西、辽宁、黑龙江、福建、湖北、 湖南、广西、海南、四川、重庆、 云南、西藏、陕西、青海、宁夏、新疆、甘肃 )
  • u******* 下载了资源 2026年春江苏开放大学大学英语B2060052作业1满分答案
  • 游客 下载了资源 爱普生Epson EP-306 驱动
  • 游客 下载了资源 爱普生Epson EP-306 驱动
  • 游客 下载了资源 佳能Canon PIXUS MG6530 驱动
点击浏览器地址栏的⭐图标收藏本页
需要托管,代写作业,论文扫码加微信
显示验证码

社交账号快速登录

微信扫一扫关注
扫码关注后会自动登录