智慧树知道网课《大数据处理和分析》课后章节测试满分答案

合集下载

2020年智慧树知道网课《大数据分析及应用》课后章节测试满分答案

2020年智慧树知道网课《大数据分析及应用》课后章节测试满分答案

第一章测试1【单选题】(2分)大数据的英文描述是()A.HeavydataB.LargedataC.GreatdataD.Bigdata2【单选题】(2分)下面最大的储存单位是()A.KBB.TBC.GBD.PB3【单选题】(2分)大数据之父是()A.詹姆斯·高斯林B.姚期智C.查尔斯·巴赫曼D.维克托·迈尔-舍恩伯格4【多选题】(2分)大数据的特点包括()A.VelocityB.ValueC.VolumeD.Variety5【多选题】(2分)第一次正式提出大数据概念和第一次用社会调查的方式分析大数据对人们生活影响的期刊是()和()A.PNASB.ScienceC.NatureD.Cell6【判断题】(2分)大数据是只和互联网相关的计算机技术。

A.错B.对7【判断题】(2分)企业中大部分的数据都是非结构化数据。

A.错B.对8【判断题】(2分)大数据技术的基础是由阿里巴巴首先提出的。

A.错B.对9【判断题】(2分)大数据人才需要数学、统计学、数学分析、商业分析和自然语言处理的多方面的学习。

A.对B.错。

智慧树知到《大数据工具应用》章节测试答案

智慧树知到《大数据工具应用》章节测试答案

绗竴绔?1銆?011骞撮害鑲敗鐮旂┒闄㈡彁鍑虹殑澶ф暟鎹畾涔夋槸锛氬ぇ鏁版嵁鏄寚鍏跺ぇ灏忚秴鍑轰簡甯歌鏁版嵁搴撳伐鍏疯幏鍙栥€佸偍瀛樸€佺鐞嗗拰锛? 锛夎兘鍔涚殑鏁版嵁闆嗐€?A:璁$畻B:璁块棶C:搴旂敤D:鍒嗘瀽绛旀: 鍒嗘瀽2銆佺敤4V鏉ユ鎷ぇ鏁版嵁鐨勭壒鐐圭殑璇濓紝涓€鑸槸鎸囷細Value銆乂elocity 銆乂olume鍜岋紙锛夈€?A:VarietyB:VainlyC:VagaryD:Valley绛旀: Variety3銆佸ぇ鏁版嵁鍒嗘瀽鍥涗釜鏂归潰鐨勫伐浣滀富瑕佹槸锛氭暟鎹垎绫汇€侊紙锛夈€佸叧鑱旇鍒欐寲鎺樺拰鏃堕棿搴忓垪棰勬祴銆?A:鏁版嵁缁熻B:鏁版嵁璁$畻C:鏁版嵁鑱氱被D:鏁版嵁娓呮礂绛旀: 鏁版嵁鑱氱被4銆佹柊娴拰浜笢鑱斿悎鎺ㄥ嚭鐨勫ぇ鏁版嵁鍟嗗搧鎺ㄨ崘锛屾槸鐢变含涓滅洸鐩帹閫佸埌褰撳墠娴忚鏂版氮缃戠珯鐨勭敤鎴风殑椤甸潰涓婄殑銆?A:瀵?B:閿?绛旀: 閿?5銆佺洰鍓嶇殑澶ф暟鎹鐞嗘妧鏈彧鑳藉鐞嗙粨鏋勫寲鏁版嵁銆?A:瀵?B:閿?绛旀: 閿?绗簩绔?1銆佹垜浠父鐢ㄧ殑寰蒋Office濂椾欢涓殑Access鏁版嵁搴撹蒋浠剁殑鏁版嵁搴撴枃浠舵牸寮忓悗缂€鍚嶆槸锛? 锛夈€?A:mdfB:mdbC:dbfD:xls绛旀: mdb2銆佸ぇ澶氭暟鏃ュ織鏂囦欢鐨勫悗缂€鍚嶆槸锛? 锛夈€?A:txtB:csvC:xmlD:log绛旀: log3銆佹湰璇剧▼閲嶇偣浠嬬粛鐨剋eka杞欢鐨勪笓鏈夋枃浠舵牸寮忔槸锛? 锛夈€?A:MongoDBB:ARFFC:valueD:key map绛旀: ARFF4銆佹暟鎹竻娲楀伐浣滅殑鐩殑涓昏鏄瑙e喅鏁版嵁鐨勫畬鏁存€с€佸敮涓€鎬с€佸悎娉曟€у拰锛? 锛夈€?A:涓撲笟鎬?B:鎺掍粬鎬?C:涓€鑷存€?D:鍏变韩鎬?绛旀: 涓€鑷存€?5銆佸叓鐖奔杞欢鐨勨€滆嚜瀹氫箟閲囬泦鈥濆伐浣滄柟寮忎笅锛岄渶瑕佸湪杞欢閲岃緭鍏ヤ竴涓紙锛夋潵浣滀负閲囬泦鐨勭洰鏍囥€?A:鐢佃瘽鍙风爜B:鍏抽敭璇?C:缃戦〉鍦板潃D:鐢ㄦ埛鍚?绛旀: 缃戦〉鍦板潃6銆佸叓鐖奔杞欢鐨勯噰闆嗚鍒欏彲浠ラ€氳繃鏂囦欢鐨勫舰寮忔潵瀵煎叆鎴栬€呭鍑猴紝杩欑鏂囦欢鐨勫悗缂€鍚嶆槸锛? 锛夈€?A:otdB:jpgC:pngD:gif绛旀: otd7銆丒xcel鍙互閫氳繃鈥滄暟鎹湁鏁堟€р€濇寜閽搷浣滄潵瑙勮寖鏁版嵁杈撳叆鐨勮寖鍥淬€?A:瀵?B:閿?绛旀: 瀵?8銆丒xcel涓嶈兘瀵煎叆txt鎴朿sv鏍煎紡鐨勬枃浠躲€?A:瀵?B:閿?绛旀: 閿?9銆佸叓鐖奔杞欢鍙兘瀵硅蒋浠跺唴寤轰簡鈥滅畝鏄撻噰闆嗏€濊鍒欑殑缃戠珯閲囬泦鏁版嵁銆?A:瀵?B:閿?绛旀: 閿?10銆佸叓鐖奔杞欢杩涜鑷畾涔夐噰闆嗘椂锛岄渶瑕佷簡瑙e缃戦〉鐨勯〉闈㈢粨鏋勩€?A:瀵?B:閿?绛旀: 瀵?绗笁绔?1銆佷娇鐢―BSCAN绠楁硶瀵归涪灏捐姳鏁版嵁闆嗭紙Iris.arff锛夎繘琛岃仛绫伙紝灏唀psilon鍙傛暟璁剧疆涓?.2锛? minPoints鍙傛暟璁剧疆涓?锛屽拷鐣lass灞炴€э紝閭d箞灏嗗舰鎴愶紙锛変釜绨囥€?A: 1B: 2C: 3D: 4绛旀: 32銆佷娇鐢‥M绠楁硶瀵瑰ぉ姘旀暟鎹泦锛坵eather.numeric.arff锛夎繘琛岃仛绫伙紝灏唍umClusters璁剧疆涓?锛屽嵆绨囨暟涓?锛屽叾浠栧弬鏁颁繚鎸侀粯璁ゅ€硷紝蹇界暐class灞炴€э紝浠庣粨鏋滀腑鍙煡锛屼笅鍒楅€夐」涓紝锛? 锛夋槸閿欒鐨勩€?A: 妯″瀷鐨勬渶澶т技鐒朵及璁″€兼槸-7.18B: 杩欑粍鏁版嵁鐢ㄧ畻娉曡凯浠?5娆?C: 绗洓涓皣鐨勫厛楠屾鐜囨槸0.14D: 绗洓涓皣鐨勫疄渚嬫暟涓?绛旀: 绗洓涓皣鐨勫疄渚嬫暟涓?3銆佷娇鐢⊿impleKMeans绠楁硶瀵瑰ぉ姘旀暟鎹泦锛坵eather.numeric.arff锛夎繘琛岃仛绫伙紝淇濇寔榛樿鍙傛暟锛屽嵆3涓皣浠ュ強娆ф皬璺濈銆傞€夋嫨play灞炴€т负蹇界暐灞炴€э紝浠庣粨鏋滀腑鍙煡锛屼笅鍒楅€夐」涓紝锛? 锛夋槸閿欒銆?A: 杩欑粍鏁版嵁鐢ㄧ畻娉曡凯浠e洓娆?B: 浜х敓浜嗕笁涓腑蹇冪偣C: 鑱氬悎涓?涓皣锛屽垎鍒湁7锛?锛?涓疄渚?D: 骞虫柟鍜岃宸负8.928绛旀: 杩欑粍鏁版嵁鐢ㄧ畻娉曡凯浠e洓娆?4銆佷娇鐢ㄧ嚎鎬у洖褰掞紙LinearRegression锛夊垎绫诲櫒鍜岀敤M5P鍒嗙被鍣ㄥcpu.arff鍒嗗埆杩涜鍒嗙被锛岀敱鍏惰緭鍑虹殑璇樊鎸囨爣鍙煡锛? 锛夈€?A: LinearRegression鐨勬爣鍑嗚宸瘮M5P鐨勬爣鍑嗚宸皬B: LinearRegression鐨勫钩鍧囩粷瀵硅宸瘮M5P鐨勫钩鍧囩粷瀵硅宸皬C: LinearRegression鐨勭浉瀵硅宸瘮M5P鐨勭浉瀵硅宸皬D: LinearRegression鐨勫钩鍧囨柟鏍硅宸瘮M5P鐨勫钩鍧囨柟鏍硅宸ぇ绛旀: LinearRegression鐨勫钩鍧囨柟鏍硅宸瘮M5P鐨勫钩鍧囨柟鏍硅宸ぇ5銆佸垹鍘籧pu.arff鏁版嵁鏂囦欢涓殑CACH灞炴€у悗锛屼娇鐢∕5P鍒嗙被鍣ㄦ瀯寤烘柟妗堬紝鍦ㄧ粨鏋滀腑锛屽埌杈綥M2鐨勫疄渚嬫暟鏈夛紙锛変釜銆?A: 165B: 21C: 23D: 30绛旀: 216銆佹牴鎹甁48鍒嗙被鍣ㄨ缁僿eather.nominal.arff鎵€鐢熶骇鐨勫喅绛栨爲锛屽綋outlook=sunny锛泃emperature=cool锛沨umidity =high锛泈indy=TRUE鏃讹紝鍒嗙被鐨勭粨鏋滄槸锛?锛夈€?A: YesB: NoC: 娌℃湁缁撴灉D: 鏃犳硶鍒嗙被绛旀: No7銆佹牴鎹甁48鍒嗙被鍣ㄨ缁僫ris.arff鎵€鐢熶骇鐨勫喅绛栨爲锛屽綋sepallength=4.4锛泂epalwidth=3.0锛沺etallength=1.3锛沺etalwidth=0.2鏃讹紝鍒嗙被鐨勭粨鏋滄槸锛? 锛夈€?A: Iris-setosaB: Iris-versicolorC: Iris-virginicaD: 鏃犳硶鍒嗙被绛旀: Iris-setosa8銆佸叧浜嶹eka绂绘暎鍖栬鏄庢纭殑鏄紙锛夈€?A: 绂绘暎鍖栨槸灏嗘暟鍊煎睘鎬ц浆鎹负瀛楃涓插瀷灞炴€?B: 鏈夌洃鐫g鏁e寲鏈変袱绉嶇瓑瀹藉拰绛夐鏂规硶C: 绛夊绂绘暎鍖栨槸浣垮疄渚嬪垎甯冨潎鍖€鐨?D: 绂绘暎鍖栧寘鎷棤鐩戠潱绂绘暎鍖栧拰鏈夌洃鐫g鏁e寲绛旀: 绂绘暎鍖栧寘鎷棤鐩戠潱绂绘暎鍖栧拰鏈夌洃鐫g鏁e寲9銆佷互涓嬶紙锛変笉鏄疻eka鐨勬暟鎹被鍨嬨€?A: numericB: nominalC: stringD: decimal绛旀: decimal10銆佸叧浜嶹eka鐨勬枃浠剁被鍨嬫弿杩伴敊璇殑鏄紙锛夈€?A: Weka鍙互鎵撳紑鏂囦欢鏍煎紡鏈?arff銆?csv銆?xlsxB: Weka澶勭悊鐨勬暟鎹泦绫讳技浜庡叧绯绘暟鎹簱妯瀹炰緥锛岀珫琛屽睘鎬?C: arff鏄疉SCII鏂囦欢锛屽彲浠ョ敤Word绛夋枃鏈紪杈戝櫒鎵撳紑鏌ョ湅D: @relation 瀹氫箟鏁版嵁闆嗗悕绉帮紝@data涔嬪悗鍛堢幇瀹炰緥锛屾瘡涓€琛屽氨鏄竴涓疄渚?绛旀: Weka鍙互鎵撳紑鏂囦欢鏍煎紡鏈?arff銆?csv銆?xlsx11銆佷互涓嬪睘浜庡叧鑱斿垎鏋愮殑鏄紙锛夈€?A: CPU鎬ц兘棰勬祴B: 璐墿绡垎鏋?C: 鑷姩鍒ゆ柇楦㈠熬鑺辩被鍒?D: 鑲$エ瓒嬪娍寤烘ā绛旀: 璐墿绡垎鏋?12銆佸ぇ鏁版嵁鏃朵唬鐨勫埌鏉ワ紝浣挎垜浠棤娉曚汉涓哄湴鍘诲彂鐜版暟鎹腑鐨勫ゥ濡欙紝涓庢鍚屾椂锛屾垜浠洿搴旇娉ㄩ噸鏁版嵁涓殑鐩稿叧鍏崇郴锛岃€屼笉鏄洜鏋滃叧绯汇€傚叾涓紝鏁版嵁涔嬮棿鐨勭浉鍏冲叧绯诲彲浠ラ€氳繃浠ヤ笅锛? 锛夌畻娉曠洿鎺ユ寲鎺樸€?A: K-meansB: Bayes NetworkC: C4.5D: Apriori绛旀: Apriori13銆佹煇瓒呭競鐮旂┒閿€鍞邯褰曟暟鎹悗鍙戠幇锛屼拱鍟ら厭鐨勪汉寰堝ぇ姒傜巼涔熶細璐拱灏垮竷锛岃繖绉嶅睘浜庢暟鎹寲鎺樼殑锛? 锛夐棶棰樸€?A: 鍏宠仈瑙勫垯鍙戠幇B: 鑱氱被C: 鍒嗙被D: 鑷劧璇█澶勭悊绛旀: 鍏宠仈瑙勫垯鍙戠幇14銆佸湪杩涜鑷姩閫夋嫨灞炴€ф椂锛屽繀椤昏绔嬩袱涓璞★紝鍏朵腑纭畾浣跨敤浠€涔堟柟娉曚负姣忎釜灞炴€у瓙闆嗗垎閰嶄竴涓瘎浼板€肩殑瀵硅薄鏄笅闈㈢殑锛? 锛夈€?A: 鎼滅储鏂规硶B: 灞炴€ц瘎浼板櫒C: 鍏冨垎绫诲櫒D: 瑙勫垯鎸栨帢绛旀: 灞炴€ц瘎浼板櫒15銆佷互涓嬪睘浜庡睘鎬х┖闂寸殑鎼滅储鏂规硶鐨勬槸锛?锛夈€?A: GainRatioAttributeEvalB: BestFirstC: PrincipalComponentsD: SymmetricalUncertAttributeEval绛旀: BestFirst16銆佸湪weka杞欢鎺㈢储鑰呯晫闈腑锛屽埄鐢╒isualize鏍囩椤甸€氳繃鏇存敼鍚勪釜鍙傛暟鏉ヨ繘琛屾暟鎹泦鐨勫彲瑙嗗寲灞炴€ц缃悗锛岄渶瑕佸崟鍑讳互涓嬶紙锛夋寜閽紝鎵€鏈夋洿鏀规墠浼氱敓鏁堛€?A: Select AttributeB: SubSampleC: UpdateD: Fast scrolling绛旀: Update17銆佺粰瀹氬叧鑱旇鍒橝B锛屾剰鍛崇潃锛氳嫢A鍙戠敓锛孊涔熶細鍙戠敓銆?A:瀵?B:閿?绛旀: 閿?18銆佹敮鎸佸害鏄閲忓叧鑱旇鍒欓噸瑕佹€х殑涓€涓寚鏍囥€?A:瀵?B:閿?绛旀: 瀵?19銆丷anker鏂规硶鏃㈠彲浠ョ敤浜庡崟涓睘鎬ц瘎浼板櫒锛屽張鍙互鐢ㄤ簬灞炴€у瓙闆嗚瘎浼板櫒銆?A:瀵?B:閿?绛旀: 閿?20銆佸埄鐢╳eka杞欢杩涜鏁版嵁鍙鍖栨椂锛岀敤鎴峰彲浠ラ€夋嫨绫诲埆灞炴€у鏁版嵁鐐圭潃鑹诧紝濡傛灉绫诲埆灞炴€ф槸鏍囩О鍨嬶紝鍒欐樉绀轰负褰╄壊鏉°€?A:瀵?B:閿?绛旀: 閿?绗洓绔?1銆佽礉鍙舵柉缃戠粶涓殑鑺傜偣浠h〃锛? 锛夈€?A:鍙橀噺B:闅忔満杩囩▼C:闅忔満鍙橀噺D:闅忔満鍑芥暟绛旀: 闅忔満鍙橀噺2銆佽礉鍙舵柉缃戠粶涓紝鑺傜偣闇€缁欏嚭姒傜巼鍒嗗竷鎻忚堪锛屽浜庣鏁e瀷闅忔満鍙橀噺鑰岃█锛屽彲浠ョ敤锛? 锛夌殑褰㈠紡琛ㄧず銆?A:鏉′欢姒傜巼瀵嗗害鍑芥暟B:姝f€佸垎甯?C:鏉′欢姒傜巼琛?D: 鍧囧寑鍒嗗竷绛旀: 鏉′欢姒傜巼琛?3銆佽礉鍙舵柉缃戠粶涓妭鐐逛箣闂寸殑杈逛唬琛紙锛夈€? A:闅忔満鍏崇郴B:姒傜巼鍥犳灉C:缁勫悎鍏崇郴D:闅忔満缁撴灉绛旀: 闅忔満鍏崇郴4銆佽礉鍙舵柉缃戠粶淇濆瓨鐨勬枃浠舵牸寮忔槸( )銆?A:XML BIFB:DOCXC: TXTD:XLS绛旀: XML BIF5銆佷笅闈紙锛変笉鏄弽鍚戜紶鎾缁忕綉缁滅殑缁撴瀯銆? A:杈撳叆灞?B:闅愬惈灞?C:璁$畻灞?D:杈撳嚭灞?绛旀: 璁$畻灞?6銆佺缁忕綉缁滀腑鐨勮妭鐐逛唬琛紙锛夈€?A:婵€鍔卞彉閲?B:婵€鍔卞嚱鏁?C:闅忔満鍙橀噺D:闅忔満鍑芥暟绛旀: 婵€鍔卞嚱鏁?7銆佷笅鍒楋紙锛変笉鏄父瑙佺殑婵€鍔卞嚱鏁般€?A:绾挎€у嚱鏁?B:Sigmoid鍑芥暟C:闃堝€煎嚱鏁?D:姝e鸡鍑芥暟绛旀: 姝e鸡鍑芥暟8銆佸湪璐濆彾鏂綉缁滅紪杈戠晫闈㈡椂锛屽鏋滆妭鐐圭殑鍚嶇О娌℃硶瀹屽叏鏄剧ず锛岄渶瑕佷粠锛? 锛夎彍鍗曢」杩涜璋冩暣銆?A:Tools|SetDataB:View|Zoom OutC:View|Zoom InD:Tools|Layout绛旀: Tools|Layout9銆乄EKA涓€夋嫨绁炵粡缃戠粶鍒嗙被鍣ㄦ搷浣滄椂锛屽簲璇ラ€夋嫨锛? 锛夈€?A:rules鏉$洰涓嬬殑PARTB:functions鏉$洰涓嬬殑SGD鍒嗙被鍣?C:functions鏉$洰涓嬬殑MultilayerPerceptron鍒嗙被鍣?D:榛樿鐨勫垎绫诲櫒绛旀: functions鏉$洰涓嬬殑MultilayerPerceptron鍒嗙被鍣?10銆佷笅闈㈠叧浜嶱ackage Manager瀹夎鍚庣殑鐩綍璇存槑涓嶆纭殑鏄紙锛夈€?A:doc瀛愮洰褰曞瓨鏀続PI鏂囨。

智慧树知到《大数据算法》章节测试答案

智慧树知到《大数据算法》章节测试答案

3.大数据算法的()特点,使其与大数据算法密切相关的。答案:速度快数据量大 A、数据量大 B、基于高度分析的新价值 C、速度快 D、多样性、复杂性 4.为解决单个计算机难以保存全部数据的问题,通常会采用并行处理的技术,此技 术会涉及到时间亚线性算法。× 1.5 1.大数据算法涉及到外存的时候,通常要分析()。答案:IO 复杂性 A、时间空间复杂性 B、IO 复杂性 C、结果质量 D、通讯复杂性 2.下列选项中,属于智能仿生算法的是()。答案:遗传算法模拟退火算法 A、遗传算法 B、近似算法 C、模拟退火算法 D、数据流算法 3.在线算法/数据流算法是面向大数据速度快的特点提出的。()√ 4.对于数据流算法或在线算法,经常要分析结果的近似比。()× 5.随机算法是利用随机化的方法来进行大数据处理,是大数据算法设计技术之一。 ()√ 2.1
()√ 4.在频繁元素计算算法中,当数据流中元素的总个数远大于估计值与真实值相差 的最多值时,可以得到频繁项一个好的估计。√ 3.3 1. 时间亚线性算法的思想是:利用特定子图联通分量的数量估计最小生成树的()。答 案:权重 A、近似值 B、精确值 C、权重 D、界限 2.求最小生成树是一个贪心法,可以用()算法来解决。答案:Prime A、Prime B、并行 C、MG D、内存 3.对联通分量个数的估计可以利用随机化方法。√ 3.4 1. 对于输入 n 个数的数组(x1,x2,x3,……,xn),输出:这个数组是否有序。远离意味 着必须删除大于()个元素才能保证剩下的元素有序。答案:n A、-n B、n C、/n
D、(1-)-近似 2.利用平面图的直径近似算法得到的解,在最坏情况下,也不会小于最优解的()。 答案:二分之一 A、二分之一 B、三分之一 C、四分之一 D、十分之一 3.采用平面图的直径近似算法的动机是无法在要求的时间内得到()。答案:精确 解 A、相似解 B、完整解 C、精确解 D、近似解 4.在平面图的直径近似算法中,要求点之间的距离满足三角不等式是指在 i、j、k 三个点中,i 到 j 的距离加上 j 到 k 的距离小于 i 到 k 的距离。× 5.近似算法能给出一个优化问题的优化解。× 6.RatioBound 越大,则近似解越坏。()√ 2.4 1. 在判定问题的近似中,对于近似解需要区分的是()。答案:差得很远是 A、是 B、否 C、差不离 D、差得很远

智慧树知到大数据分析与应用章节测试答案

智慧树知到大数据分析与应用章节测试答案

第一章单元测试1、单选题:大数据泛指巨量的()。

选项:A:数组集B:数字集C:数据集D:字符集答案: 【数据集】2、单选题:数据分析指的是用适当的()对收集来的大量数据进行分析,提取有用信息并形成结论。

选项:A:统计分析方法B:定性与定量方法C:概率分析方法D:系统分析方法答案: 【统计分析方法】3、单选题:浏览数据这一步骤可以通过对大数据进行()来实现。

选项:A:流程化B:分析化C:简易化D:可视化答案: 【可视化】4、多选题:Gartner将大数据定义为是需要新处理模式才能具有更强的()以及高增长率和多样化的信息资产。

选项:A:流程优化能力B:数据处理能力C:决策力D:洞察发现力答案: 【流程优化能力;决策力;洞察发现力】5、多选题:我们通常用“4V”来反映大数据的特点,4V是指()。

选项:A:VelocityB:VarietyC:VariousD:Valid答案: 【Velocity;Variety】6、多选题:大数据分析可以应用在那些领域()。

选项:A:商业领域B:医疗卫生领域C:交通运输领域D:农业领域答案: 【商业领域;医疗卫生领域;交通运输领域;农业领域】7、多选题:大数据分析的过程包括()。

选项:A:数据理解B:数据处理C:数据优化D:数据准备答案: 【数据理解;数据准备】8、判断题:数据只要有足够的规模就可以称为大数据。

()选项:A:对B:错答案: 【对】9、判断题:大数据分析是大数据到知识,再到信息的关键步骤。

()选项:A:错B:对答案: 【错】10、判断题:大数据分析模型用于描述数据之间的关系。

如确定自变量、因变量,进而通过聚类、回归等方法确定其关系。

()选项:A:对B:错答案: 【对】第二章单元测试1、单选题:数据仓库的定义于哪一年提出()。

选项:A:1991B:2015C:1902D:2002答案: 【1991】2、单选题:符合选择建立数据仓库平台的公认标准的是()。

选项:A:是否提供支持少量数据的数据加载B:是否支持对数据库的管理C:是否支持串联操作D:数据库对大数据量的支持能力答案: 【数据库对大数据量的支持能力】3、单选题:建立数据仓库的首要步骤是()。

智慧树知到《大数据工具应用》章节测试答案

智慧树知到《大数据工具应用》章节测试答案

1、2011 年麦肯锡研究院提出的大数据定义是:大数据是指其大小超出了常规数据库工具获取、储存、管理和()能力的数据集。

A:计算B: 访问C: 应用D: 分析答案: 分析2、用4V 来概括大数据的特点的话,一般是指:Value 、Velocity 、Volume 和()。

A:VarietyB:VainlyC:VagaryD:Valley答案: Variety3、大数据分析四个方面的工作主要是:数据分类、()、关联规则挖掘和时间序列预测。

A: 数据统计B: 数据计算C: 数据聚类D: 数据清洗答案: 数据聚类4、新浪和京东联合推出的大数据商品推荐,是由京东盲目推送到当前浏览新浪网站的用户的页面上的。

A: 对B:错5、目前的大数据处理技术只能处理结构化数据。

A: 对B: 错答案: 错第二章1、我们常用的微软Office 套件中的Access 数据库软件的数据库文件格式后缀名是()。

A:mdfB:mdbC:dbfD:xls答案: mdb2、大多数日志文件的后缀名是()。

A:txtB:csvC:xmlD:log答案: log3、本课程重点介绍的weka 软件的专有文件格式是()。

A:MongoDBB:ARFFC:valueD:key map4、数据清洗工作的目的主要是要解决数据的完整性、唯一性、合法性和()。

A: 专业性B: 排他性C: 一致性D: 共享性答案: 一致性5、八爪鱼软件的“自定义采集”工作方式下,需要在软件里输入一个()来作为采集的目标。

A: 电话号码B: 关键词C: 网页地址D: 用户名答案: 网页地址6、八爪鱼软件的采集规则可以通过文件的形式来导入或者导出,这种文件的后缀名是()。

A:otdB:jpgC:pngD:gif答案: otd7、Excel 可以通过“数据有效性”按钮操作来规范数据输入的范围。

A:对B: 错8、Excel 不能导入txt 或csv 格式的文件。

A: 对B: 错答案: 错9、八爪鱼软件只能对软件内建了“简易采集”规则的网站采集数据。

2020年智慧树知道网课《大数据概论》课后章节测试满分答案

2020年智慧树知道网课《大数据概论》课后章节测试满分答案

第一章测试1【单选题】(2分)下列哪个表述是的?A.在芯片里运行的程序可以是汇编语言编写。

B.在芯片里运行的程序可以是C语言编写。

C.在芯片里运行的程序可以是二进制语言编写。

D.在芯片里运行的程序可以是面向对象语言编写。

2【单选题】(2分)以下哪一种不是计算机操作系统?A.iOSB.LinuxC.OracleD.Android3【单选题】(2分)微软对Windows界面的开发主要受到哪家公司的启发?A.IBMB.3MC.施乐D.苹果4【单选题】(2分)Windows和Linux或者iOS和Android之间的最大区别在于什么?A.价格:前者贵后者便宜B.思想:前者封闭后者开源C.用户体验:前者优后者差D.速度:前者快后者慢5【多选题】(2分)医疗领域如何利用大数据?A.用户行为分析B.个性化医疗C.临床决策支持D.社保资金安全6【判断题】(2分)现在非结构化数据已经占人类数据量的25%。

A.对B.错7【判断题】(2分)大数据与云计算结合起来将给世界带来一场深刻的管理技术革命与社会治理创新。

A.对B.错8【单选题】(2分)Python是一种面向对象、()计算机程序设计语言。

A.解释型B.编译型9【判断题】(2分)ASCII码使用一个字节编码。

A.错B.对10【判断题】(2分)GBK是只用来编码汉字的,GBK全称《汉字内码扩展规范》,使用双字节编码。

A.对B.错第二章测试1【判断题】(2分)人类科学主要经过了经验科学、理论科学、计算科学、数据科学四个阶段。

A.错B.对2【单选题】(2分)大数据的利用过程是()。

A.采集-清洗-统计-挖掘B.采集-统计-清洗-挖掘C.采集-清洗-挖掘-统计D.采集-挖掘-清洗-统计3【判断题】(2分)信息只有通过反思、启发和学习等过程被每个个体予以有效处理,才能有用。

A.错B.对4【判断题】(2分)数据是作为信息的重要来源,信息经过加工转化为知识。

A.对B.错5【判断题】(2分)在大量知识积累基础上,总结成原理和法则,就形成了智慧。

大数据技术基础智慧树知到答案章节测试2023年东北石油大学

大数据技术基础智慧树知到答案章节测试2023年东北石油大学

绪论单元测试1.本课程中关于大数据处理与分析部分的学习内容有:()A:Mapreduce的编程模型B:大数据分析的常用算法C:大数据分析过程D:大数据分析分析工具答案:ABCD第一章测试1.大数据的基本特征包括()。

A:数据的价值密度但商业价值高B:数据增长速度快C:数据来源和数据数据类型多样化D:数据规模大答案:ABCD2.下面说法正确的是()。

A:大数据指海量多样的数据、分析数据的方法、管理数据的系统、数据的应用的统称B:大数据是第三次信息化浪潮以后产生的数据C:大数据就是数据容量达到1T以上的数据D:大数据指数据而不包括数据的分析结果答案:A3.下面哪些技术属于大数据技术。

()A:快速传输数据的技术。

B:网盘数据存储技术C:从各种数据源中采集数据的技术。

D:人脸识别技术。

答案:ABC4.如何理解“大数据分析是相关性分析而不是因果分析”。

()A:不仅要知其然,还要知其所以然。

B:不仅要进行相关分析分析,也要进行因果关系分析。

C:发现两个现象的相关性后,经过进一步深入研究,找出因果关系,就会实现技术创新。

D:相关性分析就是通过对大量数据进行统计分析,获取两个现象之间具有关联性。

答案:ABCD5.大数据的特征Variety是指:()A:数据变化多端B:数据来源广泛C:数据格式多样D:数据用途丰富答案:BC第二章测试1.在Python中,语句print(3 < 5 > 2)的输出结果为False。

()A:错B:对答案:A2.已知x是一个足够大的numpy二维数组,那么语句x[0,2]=4的作用是把行下标为0、列下标为2的元素值改为4。

()A:对B:错答案:A3.扩展库pandas中DataFrame对象的drop_duplicates()方法可以用来合并数据。

()A:对B:错答案:B4.已知x = [1,2]和y = [3,4],那么x+y的结果是()。

A:3B:7C:[4, 6]D:[1, 2, 3, 4]答案:D5.Pandas中常用的数据结构包括()。

大数据处理与分析考试试题及答案

大数据处理与分析考试试题及答案

大数据处理与分析考试试题及答案一、选择题1. 大数据的定义是以下哪一项?A. 数据量超过1TB的数据B. 数据量超过100TB的数据C. 数据量超过1PB的数据D. 数据量超过1EB的数据答案:C. 数据量超过1PB的数据2. 大数据处理的特点是以下哪一项?A. 数据量大B. 处理速度快C. 数据种类繁多D. 数据质量高答案:A. 数据量大3. 下列哪项属于大数据处理的挑战?A. 存储问题B. 安全问题C. 隐私问题D. 数据质量问题答案:B. 安全问题4. Hadoop是以下哪一个大数据处理框架的代表?A. Apache SparkB. Apache CassandraC. MapReduceD. Apache Kafka答案:C. MapReduce5. 大数据分析的目的是以下哪一项?A. 提高数据存储能力B. 增加数据处理速度C. 发现潜在的业务机会D. 优化数据传输效率答案:C. 发现潜在的业务机会二、填空题1. 关系数据库一般使用______作为数据查询语言。

(SQL)2. 数据治理是保证数据______、______、______和______的一种管理方式。

(准确性、可用性、完整性、安全性)3. 在大数据处理中,______是指对数据进行有效的汇总和调整,以适应分析或查询的需要。

(数据聚合)4. ______是一种数据存储和访问模式,能够有效地存储和查询大规模分布式数据。

(分布式文件系统)5. 大数据分析的常用技术包括______、______和______等。

(机器学习、数据挖掘、自然语言处理)三、简答题1. 请简述大数据处理的四个V特点。

答:大数据处理的四个V特点分别是:Volume(数据量大)、Velocity(处理速度快)、Variety(数据种类繁多)和Value(价值密度低)。

Volume表示大数据的特点是数据量巨大,超出了传统数据库的处理能力;Velocity表示大数据处理需要在短时间内进行高速处理;Variety表示大数据包括结构化数据、非结构化数据和半结构化数据等多种数据类型;Value表示大数据中包含了大量的背景信息和潜在的商业价值。

大数据分析与挖掘智慧树知到课后章节答案2023年下青岛黄海学院

大数据分析与挖掘智慧树知到课后章节答案2023年下青岛黄海学院

大数据分析与挖掘智慧树知到课后章节答案2023年下青岛黄海学院青岛黄海学院第一章测试1.下列选项中,用于搭建数据仓库和保证数据质量的是()。

A:数据展现 B:数据分析 C:数据收集 D:数据处理答案:数据处理2.HTML文档属于()。

A:不是数据 B:结构化数据 C:非结构化数据 D:半结构化数据答案:半结构化数据3.数据挖掘的英文缩写()。

A:DM B:DA C:DC D:DB答案:DM4.Hadoop的基础架构是()。

A:ABC都不正确B:分布式系统 C:操作系统 D:同步系统答案:分布式系统5.一般情况下,计算机处理的数据都是()。

A:无结构化的数据 B:非结构化的数据 C:半结构化的数据 D:结构化的数据答案:结构化的数据第二章测试1.在Python中实现多个条件判断需要用到与if语句的组合语句是()A:ABC均不是 B:elif C:pass D:else答案:elif2.Python 语言属于以下哪种语言()A:机器语言 B:ABC都不正确 C:高级语言 D:汇编语言答案:高级语言3.下列选项中,不是Python关键字的是()A:static B:pass C:yield D:from答案:static第三章测试1.已知x= np.array((1,2,3,4,5)),那么表达(x**2).max()的值为()。

A:20 B:25 C:15 D:30答案:252.已知x= np.array((1,2, 3, 4, 5)),那么表达式(x//5).sum()的值()。

A:2 B:3 C:4 D:1答案:13.已知x=np.array((1,2,3), 4, 5),那么表达式sum(x*x)的值()。

A:50 B:55 C:60 D:65答案:554.在Matplotlib中,用于绘制散点图的函数是()。

A:pie() B:scatter() C:bar() D:hist()答案:scatter()5.下列选项中,不属于Seaborn库特点的是()A:多个内置主题及颜色主题 B:基于网格绘制出更加复杂的图像集合 C:可以处理大量的数据流 D:Seaborn是基于Matplotlib的可视化库答案:可以处理大量的数据流第四章测试1.下列不属于HTTP请求过程的是()A:请求重定向 B:超时设置 C:搜索文档 D:生成请求答案:搜索文档2.下列关于Python爬虫库的功能,描述不正确的是()A:通用爬虫库——urllib B:Html/Xml解析器——pycurl C:爬虫库——Scrapy D:通用爬虫库——requests答案:Html/Xml解析器——pycurl3.下列对于Scrapy常用命令及其作用描述错误的是()A:list是一个全局命令,主要用于列出项目中所有可用的爬虫 B:startproject 是一个全局命令,主要用于运行一个独立的爬虫 C:crawl是一个项目命令,主要用于启动爬虫 D:genspider是一个项目命令,主要用于创建爬虫模板答案:startproject是一个全局命令,主要用于运行一个独立的爬虫4.下列请求头中,可以记载用户信息实现模拟登录的是()A:Connection B:User-Agent C:Cookie D:Host答案:Cookie5.下列不属于Scrapy框架的基本组成部分的是()A:下载器与Spiders B:引擎与调度器 C:Item Pipelnes D:解析中间件答案:引擎与调度器第五章测试1.下列关于Pandas数据读/写说法错误的是()A:to_csv函数能够读取数据库的数据写入.csv文件 B:read_csv能够读取所有文本文档的数据 C:to_excel函数能够将结构化数据写入Excel文件D:read_sql能够读取数据库的数据答案:read_csv能够读取所有文本文档的数据2.下列关于时间相关类错误的是()A:Timestamp是存放某个时间点的类 B:两个数值上相同的Period和Timestamp所代表的意义相同 C:Period是存放某个时间段的类D:Timestamp数据可以使用标准的试卷字符串转换得来答案:两个数值上相同的Period和Timestamp所代表的意义相同3.使用pivot_table函数制作透视表设置行分组键的参数为()。

2020年智慧树知道网课《大数据分析的python基础山东联盟》课后章节测试满分答案

2020年智慧树知道网课《大数据分析的python基础山东联盟》课后章节测试满分答案

2020年智慧树知道网课《大数据分析的python基础山东联盟》课后章节测试满分答案1. 第一章:Python与大数据分析大数据分析在当今信息化社会中起着重要的作用。

Python作为一种简单易学且功能强大的编程语言,成为了大数据分析的首选工具。

本章主要介绍了Python与大数据分析的关系、Python的基础知识以及大数据分析的基本流程。

2. 第二章:Python基础知识回顾在本章中,我们将回顾Python语言的基础知识,包括Python的数据类型、变量、字符串操作、数据结构(列表、元组、字典)以及流程控制语句(条件语句、循环语句)。

这些基础知识对于后续的大数据分析非常重要。

3. 第三章:NumPy库在大数据分析中的应用NumPy是Python科学计算的基础库,提供了高性能的多维数组对象和各种数学函数,非常适合用于大数据分析。

本章将介绍NumPy库的基本用法,包括数组的创建与操作、数学运算、数组的索引与切片以及数组的统计功能。

4. 第四章:Pandas库在大数据分析中的应用Pandas是Python数据分析领域的核心库,提供了高效、便捷的数据结构和数据分析工具。

本章将重点介绍Pandas库的DataFrame和Series两个核心数据结构的创建、数据的读取与写入、数据的清洗与预处理以及数据的分析与计算。

5. 第五章:Matplotlib库在大数据分析中的应用Matplotlib是Python的一个2D绘图库,可用于生成各种类型的静态、动态、交互式图表和图形。

本章将介绍Matplotlib库的基本用法,包括图形的创建与绘制、坐标轴设置、图例与注释、图表样式美化以及图表的保存与分享。

6. 第六章:Seaborn库在大数据分析中的应用Seaborn是建立在Matplotlib之上的一个Python数据可视化库,提供了一些高级的统计图表和作图功能,能够帮助我们更加简洁、美观地展示数据分析的结果。

本章将介绍Seaborn库的基本用法,包括数据可视化的常用图表、调色板设置、多图表拼接以及图表样式设置。

2021知到答案 大数据分析与可视化 最新智慧树满分章节测试答案

2021知到答案 大数据分析与可视化 最新智慧树满分章节测试答案

第一章单元测试1、单选题:什么是KDD?()选项:A:动态知识发现B:数据挖掘与知识发现C:文档知识发现D:领域知识发现答案: 【数据挖掘与知识发现】2、判断题:数据挖掘分析是指从海量的数据中抽取感兴趣的(有价值的、隐含的、以前没有用但是潜在有用信息的)模式和知识。

()选项:A:对B:错答案: 【对】3、多选题:数据挖掘分析的步骤包括()选项:A:算法分析B:创建数据集C:模型评估D:数据预处理答案: 【算法分析;创建数据集;模型评估;数据预处理】4、判断题:当今社会,数据挖掘分析被广泛应用。

()选项:A:对B:错答案: 【对】5、多选题:()是未来大数据分析的发展趋势。

选项:A:可视化C:非结构化数据D:实时性答案: 【可视化;非结构化数据;实时性】第二章单元测试1、多选题:关于描述统计,包括()。

选项:A:离中趋势分析B:相关分析C:集中趋势分析D:其余选项都不是答案: 【离中趋势分析;相关分析;集中趋势分析】2、单选题:以下属于推断统计的是()。

选项:A:集中趋势分析B:参数估计C:离中趋势分析D:其余选项都不是答案: 【离中趋势分析】3、多选题:在数据特征的测度中,描述分布的形状的值为()选项:A:中位数B:偏态C:峰态D:众数答案: 【偏态;峰态】4、判断题:测度集中趋势就是寻找数据水平的代表值或中心值()选项:A:对答案: 【对】5、判断题:四分位数可以用于顺序数据、数值数据和分类数据()选项:A:错B:对答案: 【错】第三章单元测试1、单选题:下面哪个属于映射数据到新的空间的方法?( )选项:A:傅立叶变换B:渐进抽样C:维归约D:特征加权答案: 【傅立叶变换】2、单选题:将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?()选项:A:分类和预测B:数据预处理C:数据流挖掘D:频繁模式挖掘答案: 【数据预处理】3、单选题:影响数据质量问题的因素有哪些()选项:A:其余选项都对B:相关性、时效性C:准确性、完整性、一致性D:可信性、可解释性答案: 【其余选项都对】4、多选题:数据预处理的常见方法有()选项:A:数据清洗B:其余选项都不对C:数据变换D:数据集成答案: 【数据清洗;数据变换;数据集成】5、判断题:数据预处理是指在对数据进行挖掘分析以前,需要对原始数据进行清理、集合和变换等一系列处理工作()选项:A:错B:对答案: 【对】第四章单元测试1、单选题:考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含()选项:A:1,2,3,5B:1,2,3,4C:1,3,4,5D:1,2,4,5答案: 【1,2,4,5】2、单选题:频繁项集、频繁闭项集、最大频繁项集之间的关系是:( )选项:A:频繁项集频繁闭项集最大频繁项集B:频繁项集= 频繁闭项集= 最大频繁项集C:频繁项集= 频繁闭项集最大频繁项集D:频繁项集频繁闭项集=最大频繁项集答案: 【频繁项集频繁闭项集最大频繁项集】3、单选题:某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?( )选项:A:分类B:自然语言处理C:聚类D:关联规则发现答案: 【关联规则发现】4、单选题:下面购物篮能够提取的3-项集的最大数量是多少()ID 购买项1 牛奶,啤酒,尿布2 面包,黄油,牛奶3 牛奶,尿布,饼干4 面包,黄油,饼干5 啤酒,饼干,尿布6 牛奶,尿布,面包,黄油7 面包,黄油,尿布8 啤酒,尿布9 牛奶,尿布,面包,黄油10 啤酒,饼干选项:A:4B:2C:1D:3答案: 【3】5、多选题:Apriori算法的计算复杂度受( )影响。

智慧树大数据解析与应用导论章节测验答案

智慧树大数据解析与应用导论章节测验答案

解忧书店 JieYouBookshop 第一章单元测试1【多选题】 (2分)下列属于多元统计方法的为()A.决策树B.神经网络C.回归分析D.主元分析2【多选题】 (2分)多元统计分析的图表示法有()A.轮廓图B.雷达图C.散布图矩阵D.调和曲线图3【判断题】 (2分)完整的数据分析过程,包括数据采集、数据清洗和数据分析。

()A.对B.错4【单选题】 (2分)下列场景适用于回归分析的是 ( )A.人脸识别B.天气预报C.水果分拣D.信息浓缩5【单选题】 (2分)下面哪一句体现了主元分析的思想()A.物以类聚,人以群分B.笨鸟先飞C.牵牛要牵牛鼻子D.人不是一座孤岛第二章单元测试1【多选题】 (2分)一般常见的缺失值处理的方法有()A.插值填充B.回归填充法C.最近邻插补填充法D.替换填充法2【多选题】 (2分)一般常见的数据归一化的方法有()A.回归填充法B.最小最大规范化C.零均值规范化D.替换填充法3【判断题】 (2分)少量的异常值完全不会影响数据分析。

()A.对B.错4【单选题】 (2分)下列哪种方法不是数据填补的手段 ( )A.替换填充法B.回归填充法C.插值填充法D.均值标准化5【单选题】 (2分)主成分分析的英文名是()。

A.Principal Component AnalysisB.Ordinary Least SquaresC.Canonical Component AnalysisD.Partial Least Squares第三章单元测试1【多选题】 (2分)下面哪个是SVM在实际生活中的应用()A.邮件分类B.文本翻译C.房价预测D.图片分类2【多选题】 (2分)以下说法正确的有哪些()A.SVM是一种线性方法B.软间隔的引入可以解决轻度线性不可分问题C.SVM只能够解决回归问题D.核方法不能解决非线性问题3【判断题】 (2分)拉格朗日乘子法可用于线性可分SVM的模型求解。

智慧树知到大数据工具应用章节测试答案

智慧树知到大数据工具应用章节测试答案

智慧树知到大数据工具应用章节测试答案第一题:大数据工具是指用于处理大规模数据的软件和技术工具。

它们能够帮助用户快速、高效地处理和分析海量数据,从而发现数据中隐藏的规律和价值。

大数据工具的应用范围非常广泛,包括数据清洗、数据存储、数据分析、数据可视化等方面。

第二题:Hadoop是一种分布式计算框架,主要用于存储和处理大规模数据。

它由Hadoop分布式文件系统(HDFS)和Hadoop分布式计算框架(MapReduce)两部分组成。

HDFS用于将数据分布式存储在多台机器上,而MapReduce则用于将数据分布式处理和计算。

Hadoop具有高可靠性、高扩展性和高容错性的特点,适用于处理大规模数据。

第三题:Hive是一种基于Hadoop的数据仓库工具,它提供了类似于SQL的查询语言,可以将结构化数据映射到Hadoop集群上进行查询和分析。

Hive将查询语句转化为MapReduce任务,在Hadoop集群上执行。

Hive适用于处理结构化数据,如日志数据、用户行为数据等。

它提供了丰富的数据处理函数和数据转换功能,能够满足大部分数据分析的需求。

第四题:Spark是一种快速、通用的大数据处理引擎,它可以在内存中高效地处理大规模数据。

Spark提供了丰富的API,支持多种编程语言,如Java、Scala和Python。

Spark的核心概念是弹性分布式数据集(RDD),它是一种抽象的数据结构,可以在集群中并行处理和计算。

Spark具有高速、易用和可扩展的特点,适用于各种大数据处理场景。

第五题:Flink是一种流式处理框架,它能够实时处理和分析数据流。

Flink提供了流处理和批处理两种模式,可以处理无界数据流和有界数据集。

Flink具有低延迟、高吞吐量和容错性的特点,适用于实时数据处理和流式计算。

Flink支持多种数据源和数据接收器,可以与其他大数据工具无缝集成。

第六题:Kafka是一种分布式消息队列系统,用于高吞吐量的发布/订阅消息传输。

智慧树知到《大数据处理和分析》章节测试答案

智慧树知到《大数据处理和分析》章节测试答案

C:数据导入操作未正常完成 D:无正确答案 答案:AC 6、 当 sourcetype=abc 时,abc 表示(D:文件类型 答案:D 7、 下列哪条 SPL 语句是正确的( ) A:| fields -ran B:top 5 C:|top -ran D:fields ran 答案:A 8、 创建一个新的字段,一般需要 SPL 命令( ) A:| eval B:| fields C:| stats D:| streamstats 答案:ACD 9、 不显示一个字段,需要用到( )命令
智慧树知到《大数据处理和分析》章节测试答案 第一章 1、 大数据分析的最终目的是( ) A:发现数据 B:查找数据 C:处理数据 D:通过数据分析来挖掘数据背后的价值 答案: 通过数据分析来挖掘数据背后的价值 2、 数据采集的方式包括( ) A:主动数据采集 B:购买数据 C:网络下载数据 答案: 主动数据采集,购买数据,网络下载数据 3、 Wireshark 是手机数据的采集软件( ) A:对 B:错 答案: 对 4、 手机和手机 APP 是同时连通网络的( ) A:对 B:错 答案: 错 5、 360 随身 WIFI 的目的是( )
答案:A 6、涨跌线是具有两个以上数据系列的折线图中的条形柱,可以清晰地指明初始数 据系列和终止数据系列中数据点之间的差别。 A:对 B:错 答案:A 7、 趋势线只能预测下一周期的情况。 A:对 B:错 答案:B 8、 当插入图表后再修改源数据表,图表会实现自动更新。 A:对 B:错 答案:A 9、 组合图(表)是指在一个图表中表示两个或两个以上的数据系列,不同的数 据系列用不同的图表类型表示。 A:对 B:错 答案:A 10、 在 Excel 中创建的图表后,可以编辑的元素只有图表标题。 A:对 B:错 答案:B

智慧树知 到《大数据分析的python基础》章节测试答案

智慧树知 到《大数据分析的python基础》章节测试答案
if i == 'N':
break
A:CCHHIINNAA
B:CCHHIIAA
C:CCHHIAA
D:CCHHIINAA
答案:
第五章
1、定义函数时,即使该函数不需要接收任何参数,也必须保留一对空的圆括号来表示这是一个函数.
A:对
B:错
答案:A
2、关于函数,以下选项中描述错误的是:()
A:函数能完成特定的功能,对函数的使用不需要了解函数内部实现原理,只要了解函数的输入输出方式即可。
D:运行出错
答案:C
7、以下选项中能生成一个空字典的是:()
A:{}
B:dict()
C:dict([])
D:{[]}
答案:B
8、给定字典d,以下选项中对d.get(x, y)的描述错误的是:()
A:返回字典d中键值对为x:y的值
B:返回字典d中键为x的值,如果不存在.则返回y
C:返回字典d中键为X的值如果不存在,则返回空
B:Python 中 if-else 语句用来形成二分支结构
C:Python 中 if-elif-else 语句描述多分支结构
D:分支结构可以向已经执行过的语句部分跳转
答案:D
3、下面代码的输出结果是: ( )
a = [[1,2,3], [4,5,6], [7,8,9]]
s = 0
for c in a:
C:元组中元素不可以是不同类型
D:一个元组可以作为另一个元组的元素,可以采用多级索引获取信息
答案:C
3、以下选项中,不是具体的Python序列类型的是:()
A:字符串类型
B:元组类型
C:数组类型
D:列表类型
答案:C

智慧树答案大数据分析导论知到课后答案章节测试2022年

智慧树答案大数据分析导论知到课后答案章节测试2022年

第一章1.下列选项中,哪个工具不是词云工具()。

答案:Highstock2.下列论据中,能够支撑“大数据无所不能”的观点的是( )。

答案:互联网金融打破了传统的观念和行为3.大数据的最显著特征是( )。

答案:数据规模大4.大数据的价值体现在()。

答案:大数据为政策制定提供科学论据;大数据助力智慧城市提升公共服务水平;大数据的发力点在于预测;大数据给思维方式带来了冲击;大数据实现了精准营销5.大数据分析的陷阱,包括:()。

答案:观测维度有误,造成“精心挑选的数据维度”;比较对象不当,造成“缺失或不匹配的比较”;不谨慎的归因,造成“相关性的误解”;只信亲身经历,造成“基于个案的认知”第二章1.采集一手数据,有两种方式:()。

答案:实验;调查2.当前大数据技术的基础包括()答案:分布式文件系统;分布式并行计算;分布式数据库3.大数据产业发展的特点是()。

答案:多产业交叉融合答案:ACE;规模较大 ;增速很快第三章1.非需求数据清洗阶段,主要工作就是删除不需要的字段。

()答案:对2.当前,企业提供的大数据解决方案大多基于Hadoop 开源项目。

()答案:对3.大数据可以分析与挖掘前之前人们不知道或者没有注意到的模式,可以从海量数据中发展趋势,虽然也有不精准的时候,但并不能因此而否定大数据挖掘的价值。

()答案:对第四章1.CRISP-DM模型,又被称为“跨行业数据挖掘标准流程“,将数据挖掘分为了6个不同的,但顺序并非完全不变的阶段:分别是:商业理解、数据理解、数据预处理、建立模型、模型评估和方案实施。

()答案:对2.数据挖掘应当更正确地命名为“从数据中挖掘知识”,不幸的是它有点长。

许多人把数据挖掘视为另一个常用的术语‘数据库中知识发现’或KDD的同义词。

而另一些人只是把数据挖掘视为数据库中知识发现过程的一个基本步骤。

()答案:对3.7.数据挖掘就是对观测到的数据集(经常是很庞大的)进行分析,目的是发现未知的关系和以数据拥有者可以理解并对其有价值的新颖方式来总结数据。

大数据分析与应用智慧树知到答案章节测试2023年咸阳职业技术学院

大数据分析与应用智慧树知到答案章节测试2023年咸阳职业技术学院

第一章测试1.HDFS 已经成为了大数据磁盘存储的事实标准,针对关系型以外的数据模型,开源社区形成了 K-V( key-value)、列式、()、图这四类 NoSQL 数据库体系。

A:数据仓库B:文档C:关系数据库D:表格答案:B2.麦肯锡全球研究所对大数据的定义是()。

A:数据量庞大、产生速度快的数据成为大数据B:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征C:大数据指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才具有更强的决策力、洞察发现力和流程化能力的海量、高增长率和多样化的信息资产D:大数据是数据量庞大的数据集合答案:B3.大数据应用场景不包括()。

A:个性化服务B:人群标签,精准营销C:商品推荐D:生活家用答案:B4.DataWorks是一个提供了大数据OS能力、并以all in one box的方式提供专业高效、安全可靠的一站式大数据智能云研发平台。

同时能满足用户对数据治理、质量管理需求,赋予用户对外提供数据服务的能力。

()A:对B:错答案:A5.云原生数据仓库MySQL版(简称ADB,原AnalyticDB for MySQL)是一种高并发低延时的PB级新一代云原生数据仓库,全面兼容MySQL协议以及SQL:2003 语法标准,可以毫秒级针对万亿级数据进行即时的多维分析透视和业务探索。

()A:对B:错答案:A第二章测试1.ETL是Extract、 Transform、 Loading三个字母的缩写,即抽取、转换、()。

A:装载B:预处理C:清洗D:升级答案:A2.HBase是一个构建在HDFS上的分布式列存储系统,用于海量结构化、半结构化数据存储。

()A:错B:对答案:B3.数据规约:在尽可能保持数据原貌的前提下,最大限度地精简数据量。

大数据基础智慧树知到课后章节答案2023年下浙江经贸职业技术学院

大数据基础智慧树知到课后章节答案2023年下浙江经贸职业技术学院

大数据基础智慧树知到课后章节答案2023年下浙江经贸职业技术学院浙江经贸职业技术学院第一章测试1.大数据产生于()。

A:第2次信息化浪潮 B:信息时代 C:第3次信息化浪潮 D:第1次信息化浪潮答案:第3次信息化浪潮2.大数据的起源是()。

A:互联网 B:金融 C:公共管理 D:电信答案:互联网3.当前大数据技术的基础是由()首先提出的。

A:谷歌 B:微软 C:阿里巴巴 D:百度答案:谷歌4.大数据的最显著特征是()。

A:数据类型多样 B:数据规模大 C:数据处理速度快 D:数据价值密度高答案:数据规模大5.大数据时代,数据使用的关键是()。

A:数据收集 B:数据再利用 C:数据分析 D:数据存储答案:数据再利用第二章测试1.在Linux系统中,以下哪个目录是存放用户主目录的?()。

A:/usr B:/var C:/home D:/etc答案:/home2.在Linux系统中,以下哪个命令可以复制文件?()。

A:mv B:rm C:cp D:mkdir答案:cp3.在Linux系统中,以下哪个命令可以创建一个空文件?()。

A:echo B:touch C:cat D:vi答案:touch4.在Linux系统中,以下哪个目录是存放系统配置文件的?()。

A:/bin B:/usr C:/var D:/etc答案:/etc5.在末行模式下,键入什么命令可以不保存退出vi编辑器对文件/etc/inittab的修改?()。

A::q! B::wq C::x! D:在编辑模式下,键入“ESC”键直接退出答案::q!第三章测试1.分布式存储系统可以分为不同类型,属于()的,如Hadoop的HDFS。

A:分布式数据库 B:分布式键值系统 C:分布式表格系统 D:分布式文件系统答案:分布式文件系统2.作为HDFS的基础概念,其中()是指元数据节点。

A:NameNode B:Secondary NameNode C:Block D:DataNode答案:NameNode3.以下命令中的(),是把HDFS系统的文件夹zjiet1内的文件a.txt下载到本地系统的文件夹zjiet2。

智慧树知到《大数据处理和分析》章节测试答案

智慧树知到《大数据处理和分析》章节测试答案

答案: 三次握手协议 9、 手机连接网络是用到( )协议 A:通讯协议 B:ICMPv6 C:三次握手协议 答案: ICMPv6 10、 手机数据捕获软件是( ) A:Excel B:Splunk C:Wireshark D:Total Control 答案: Wireshark 第三章 1、 在实验中是手机最先连接到网络( ) A:对 B:错 答案:A 2、 手机联网时间可以通过查找三次握手协议获得 A:对 B:错 答案:B
A:对 B:错 答案:B 第五章 1、 输入的公式中包含明显的除数为零(0),则会出现#DIV/O!错误。 A:对 B:错 答案:A 2、 退休日期的计算常使用 edate 函数。 A:对 B:错 答案:A 3、 公式“=SUM(“2”,18,True)”的计算结果为( )。 A:21 B:22 C:23 D:错误值 答案:A 4、 A1,A2,A3 单元格的值分别为 1,”2”,True,则 sum(A1:A3)的值为( )。 A:1 B:2 C:3

B:错 答案: 对 10、 在手机断开 WIFI 之后,手机 APP 会( ) A:继续连接网络 B:立即断开网络 C:无法判断 答案: 立即断开网络 第二章 1、 打开 Wireshark 软件,可以从主界面的 Open 选项打开*.CSV 文件( ) A:对 B:错 答案: 错 2、 分析手机 APP 的联网效率需要用到( ) A:TCP 协议 B:ICMPV6 协议 C:DNS 协议 D:IP 协议 答案: TCP 协议,ICMPV6 协议,IP 协议 3、 双击我的电脑,可以查看计算机中的 IP 地址( ) A:对 B:错 答案: 错
4、 打开手机的设置,可以查看到手机的 IP 地址 A:对 B:错 答案: 对 5、 Wireshark 能够记录手机的 IP 地址并在目标地址位置显示出来( ) A:对 B:错 答案: 错 6、 三次握手协议是属于( ) A:ICMPV6 协议 B:DNS 协议 C:TCP 协议 D:IP 协议 答案: TCP 协议 7、 TCP 协议中的 FIN 表示建立连接 A:对 B:错 答案: 错 8、 手机 APP 连接网络时用到( )协议 A:通讯协议 B:ICMPv6 C:三次握手协议
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一章测试
1
【单选题】(2分)
大数据分析的最终目的是()
A.
通过数据分析来挖掘数据背后的价值
B.
发现数据
C.
处理数据
D.
查找数据
2
【多选题】(2分)
数据采集的方式包括()
A.
网络下载数据
B.
主动数据采集
C.
购买数据
3
【判断题】(2分)
Wireshark是手机数据的采集软件()
A.

B.

4
【判断题】(2分)
手机和手机APP是同时连通网络的()
A.

B.

5
【单选题】(2分)
360随身WIFI的目的是()
A.
构造局域网,从而让手机连通电脑
B.
让手机APP连通电脑
C.
让电脑成为一个WIFI发射装置
D.
让电脑上网
6
【多选题】(2分)
对于电脑+手机+360WIFI而言,它们之间存在的网络包括()
A.
手机的4G网络
B.
路由器产生的网络
C.
360WIFI构成的无线网络
D.
笔记本电脑连接的Internet网络
7
【判断题】(2分)
手机APP的联网效率是指手机联上网络的时间T1和手机APP联上网络的时间T2之差()
A.

B.

8
【判断题】(2分)
在上一题中,T1-T2的值越小时,手机APP的联网效率越高。

()
A.

B.

9
【判断题】(2分)
开始手机数据收集之前,需要先关闭手机的3G或者4G网络,仅让手机连接360WIFI的网络()
A.

B.

10
【单选题】(2分)
在手机断开WIFI之后,手机APP会()
A.
立即断开网络
B.
无法判断
C.
继续连接网络。

相关文档
最新文档