เนื้อหา ของ งานศึกษาวิกิพีเดียทางวิชาการ

การสร้าง

ผู้แก้ไขส่วนน้อยสร้างเนื้อหาที่คงยืนส่วนมาก

ในวรรณกรรมทรงอิทธิพลที่ทบทวนโดยผู้รู้เสมอกัน[2]ซึ่งหนังสือพิมพ์รายวันอังกฤษเดอะการ์เดียนได้กล่าวถึง[3]ทีมนักวิจัยหกท่านจากมหาวิทยาลัยมินนิโซตา (สหรัฐ) ได้วัดความสัมพันธ์ระหว่างจำนวนการแก้ไขกับจำนวนการดูคำที่ผู้เขียนนั้น ๆ เขียน โดยวัดเป็นจำนวนการดูคำที่ผู้เขียนเพิ่มขึ้นในบทความ ซึ่งเรียกว่า persistent word views (PWV)ผู้เขียนงานวิชาการอธิบายวิธีการนับได้ดีที่สุดคือ "แต่ละครั้งที่ดูบทความ คำแต่ละคำก็ได้ดูด้วยเมื่อดูคำที่เขียนโดยผู้เขียน ก ผู้เขียนก็จะได้รับเครดิตเป็นหนึ่ง PWV (เรียกว่าเป็นคะแนนต่อจากนี้)"จำนวนการดูบทความประมาณจากบันทึกของเว็บเซิร์ฟเวอร์

นักวิจัยวิเคราะห์ 25 ล้านล้านคะแนน (1012) ที่ให้กับผู้ใช้ลงทะเบียนระหว่าง 1 กันยายน 2002 จนถึง 31 ตุลาคม 2006ที่สุดของระยะนี้ ผู้แก้ไขมากสุดระดับ 1/10 (นับจำนวนแก้ไข) ได้คะแนนร้อยละ 86, ผู้แก้ไขมากสุด 1/100 ได้คะแนนร้อยละ 70 และผู้แก้ไขมากสุด 1/1000 (จำนวน 4,200 คน) ได้คะแนนร้อยละ 44 ซึ่งเท่ากับค่าวัดเกือบครึ่งหนึ่งตามงานศึกษานี้ผู้แก้ไขมากสุด 10 คนแรก (ตามคะแนนดังว่า) ได้คะแนนเพียงแค่ร้อยละ 2.6 และเพียง 3 คนเท่านั้นที่มีจำนวนการแก้ไขในท๊อป 50จากข้อมูลนี้ นักวิจัยได้อนุมานความสัมพันธ์ดังต่อไปนี้คือ

การเพิ่มแชร์ของ PWV เพิ่มขึ้นอย่างซูเปอร์ชี้กำลัง (super-exponentially) ตามลำดับจำนวนการแก้ไขกล่าวอีกอย่างก็คือ ผู้แก้ไขอภิชน (คือคนที่แก้ไขมากสุด) มอบคุณประโยชน์ให้ "มากกว่า" ที่ปกติจะได้ตามความสัมพันธ์แบบเลขชี้กำลัง

งานศึกษายังได้วิเคราะห์ผลของบอต[upper-alpha 1]ต่อเนื้อหาตามจำนวนการแก้ไข บอตเป็นเจ้าวิกิพีเดียผู้ใช้ 9 คนในท๊อป 10 และ 20 คนในท๊อป 50 เป็นบอตแต่ตามลำดับคะแนน PWV บอต 2 บอตเท่านั้นที่อยู่ในท๊อป 50 โดยไม่มีเลยในท๊อป 10

ตามการเพิ่มอิทธิพลของผู้แก้ไขท๊อป 1/1000 ตามลำดับคะแนน PWV งานศึกษาได้ฟันธงว่า

...ผู้แก้ไขบ่อย ๆ ควบคุมสิ่งที่คนเห็นเมื่อมาเยี่ยมวิกิพีเดียและ ...การควบคุม/ความเป็นเจ้าเช่นนี้ก็กำลังเพิ่มขึ้นเรื่อย ๆ

การแจกแจงงานและลำดับชั้นทางสังคม

วรรณกรรมที่ทบทวนโดยผู้รู้เสมอกันให้ข้อสังเกตว่า สังคมวิกิพีเดียมีลำดับชั้นเพราะมีชนชั้น "ผู้ดูแลระบบ/แอดมิน"[upper-alpha 1]งานนี้เสนอว่า การจัดลำดับชั้นเช่นนี้อาจมีประโยชน์ในบางเรื่อง แต่ก็ระบุว่าผู้ดูแลระบบและผู้ใช้อื่น ๆ มีอำนาจและสถานะที่ไม่เท่ากันอย่างชัดเจน[4]

เมื่อวิเคราะห์ประวัติการแก้ไขวิกิพีเดียอังกฤษทั้งหมดจนถึงเดือนกรกฎาคม 2006 งานศึกษาเดียวกันระบุว่า อิทธิพลการแก้ไขเนื้อหาของผู้ดูแลระบบได้ลดลงเรื่อย ๆ ตั้งแต่ปี 2003 เมื่อผู้ดูแลระบบแก้ไขเนื้อหาในอัตราร้อยละ 50 เทียบกับปี 2006 ที่ร้อยละ 10นี่เกิดแม้จำนวนการแก้ไขเฉลี่ยต่อผู้ดูแลระบบจะเพิ่มขึ้นเป็น 5 เท่าในช่วงเวลาเดียวกันปรากฏการณ์นี้นักวิจัยได้ตั้งชื่อว่า "rise of the crowd" (กำเนิดชุมนุมชน)การวิเคราะห์ที่วัดจำนวนคำที่เขียนแทนที่จำนวนการแก้ไขก็มีรูปแบบคล้าย ๆ กัน

เพราะผู้ดูแลระบบต่าง ๆ กันมากในเรื่องจำนวนการแก้ไข งานศึกษาจึงแบ่งผู้ใช้ตามจำนวนการแก้ไขด้วยผลสำหรับ "ผู้แก้ไขอภิชน/อีลี้ต" คือผู้ใช้ที่แก้ไขมากกว่า 10,000 ครั้ง ใกล้เคียงกับที่พบในผู้ดูแลระบบยกเว้นว่า จำนวนคำที่เปลี่ยนโดยผู้ใช้อภิชนยังตามทันจำนวนการเปลี่ยนแปลงของผู้ใช้ใหม่ แม้จำนวนการแก้ใขของผู้ใช้ใหม่ก็ยังเติบโตในสัดส่วนที่เร็วกว่าผู้ใช้อภิชนได้เครดิตสำหรับการแก้ไขร้อยละ 30 ในปี 2006 งานศึกษาสรุปว่า

แม้อิทธิพลของพวกเขาจะโรยลงในปีที่ผ่านมาไม่นานนี้ ผู้ใช้อภิชนก็ยังปรากฏกว่ามอบงานใหญ่พอดูให้แก่วิกิพีเดีย อนึ่ง การแก้ไขของผู้ใช้อภิชนดูจะมีแก่นสาร คือ พวกเขาไม่เพียงแค่แก้คำผิดหรือเปลี่ยนแบบการอ้างอิง ...

ความเชื่อถือได้

เอกสารงานประชุมทางปรัชญาด้านวิธีการให้เหตุผลปี 2010 ได้ประเมินว่าความเชื่อถือได้ของวิกิพีเดียมาจากคุณค่าทางญาณวิทยา หรือมาจากคุณค่าที่ปฏิบัติได้โดยสรุปว่า แม้ผู้อ่านอาจไม่สามารถประเมินความรู้และความเชี่ยวชาญ (ซึ่งเป็นคุณค่าทางญาณวิทยา) ของผู้เขียนบทความหนึ่ง ๆ แต่ก็อาจประเมินความหลงใหลของผู้เขียน และวิธีการสื่อสารที่ทำความหลงใหลนั้นให้ปรากฏ ซึ่งเป็นเหตุผลให้เชื่อถือ[5]

รายละเอียดก็คือ ผู้เขียนเอกสารได้อ้างว่า วิกิพีเดียเชื่อถือไม่ได้เพราะความเชี่ยวชาญของเอกบุคคล ความรู้ของคนโดยรวม ๆ หรือประสบการณ์ให้เชื่อถือได้ในอดีตนี่ก็เพราะความนิรนามหรือการใช้นามแฝงป้องกันไม่ให้ประเมินความรู้ของผู้เขียนได้ และวัฒนธรรมต่อต้านผู้เชี่ยวชาญของวิกิพีเดียก็ทำให้เรื่องนี้แก้ไขได้ยากการแก้ไขวิกิพียเดียโดยมากยังจำกัดอยู่ในวงผู้แก้ไขที่เป็นอภิชน โดยไม่ได้ประมวล "ปัญญาของชุมชน" ซึ่งในบางกรณีก็ทำคุณภาพของบทความให้ตกลงเสียเองประสบการณ์ส่วนตัวในอดีตบวกกับงานศึกษาเชิงประสบการณ์ รวมทั้งเหตุการณ์ก่อการโต้แย้งของวิกิพีเดียในอดีต (รวม Seigenthaler biography controversy) อาจทำให้สรุปได้ว่า วิกิพีเดียโดยทั่วไปเชื่อถือไม่ได้ดังนั้น ปัจจัยทางญาณวิทยาเหล่านี้จึงไม่เป็นเหตุผลให้ใช้วิกิพีเดีย

ผู้เขียนเอกสารต่อมาจึงเสนอเหตุผลให้เชื่อถือวิกิพีเดียอาศัยคุณค่าที่ปฏิบัติได้ ซึ่งอาจกล่าวอย่างคร่าว ๆ ว่ามีสองปัจจัย ปัจจัยแรกคือ ขนาดและกิจกรรมมหาศาลในวิกิพีเดียเป็นเครื่องระบุว่า ผู้แก้ไขบทความมุ่งมั่นให้ความรู้แก่ชาวโลกปัจจัยที่สองคือ การพัฒนานโยบาย แนวปฏิบัติ สถาบัน และเทคโนโลยีที่โปร่งใส นอกเหนือจากกิจกรรมมหาศาลที่มองเห็นได้ ช่วยคลายความเคลือบแคลงใจในเรื่องต่าง ๆ ที่บุคคลอาจมีในการเชื่อวิกิพีเดียความเคลือบแคลงที่ยกขึ้นรวมทั้ง นิยามว่าอะไรคือความรู้ การป้องกันการแก้ไขอย่างบิดเบือนของกลุ่มบุคคลที่ไม่มีความมุ่งมั่นเช่นกัน การแก้ไขความเสียหายต่อบทความให้ถูกต้อง การควบคุณและการเพิ่มพูนคุณภาพของบทความ

ภูมิศาสตร์

งานวิจัยของสถาบันอินเทอร์เน็ตของมหาวิทยาลัยออกซฟอร์ดได้แสดงว่า จนถึงปลายปี 2009 บทความวิกิพีเดียที่ติดพิกัด (คือที่ใช้แม่แบบ Coord) ตลอดทุกภาษา ครอบคลุมสถานที่ประมาณ 500 ล้านแห่งในโลกแต่ก็มีการแจกแจงทางภูมิศาสตร์ที่/ไม่เสมอกันบทความโดยมากเกี่ยวกับทวีปอเมริกาเหนือ ยุโรป และเอเชียตะวันออก โดยไม่ครอบคลุมเขตภูมิศาสตร์ขนาดใหญ่ในประเทศกำลังพัฒนา รวมทั้งแอฟริกาโดยมาก[6]

การประมวลภาษาธรรมชาติ

เนื้อหาที่เป็นถ้อยคำและลำดับชั้นอันเป็นโครงร่างบทความของวิกิพีเดียได้กลายเป็นแหล่งความรู้สำคัญอย่างหนึ่งสำหรับนักวิจัยในการประมวลภาษาธรรมชาติและปัญญาประดิษฐ์ในปี 2007 นักวิจัยที่สถาบันเทคโนโลยีเทคนิออน-อิสราเอลได้พัฒนาเทคนิคที่เรียกว่า Explicit Semantic Analysis (การวิเคราะห์ความหมายชัดแจ้ง)[7]ซึ่งใช้ความรู้เกี่ยวกับโลกที่ได้จากวิกิพีเดียอังกฤษระบบสร้างตัวแทนทางแนวคิดโดยใช้คำและตัวบทโดยอัตโนมัติ ซึ่งสามารถใช้คำนวณความคล้ายคลึงกันระหว่างคำกับคำและตัวบทกับตัวบท

ส่วนนักวิจัยที่แหล็บประมวลผลความรู้แพร่หลาย (Ubiquitous Knowledge Processing Lab) ที่มหาวิทยาลัยเทคโนโลยีดาร์มชตัทแห่งประเทศเยอรมนีได้ใช้ความรู้เกี่ยวกับภาษาและโลกที่อยู่ในวิกิพีเดียและวิกิพจนานุกรมเพื่อสร้างฐานความรู้เกี่ยวกับภาษาคล้ายกับทรัพยากรที่ผู้เชี่ยวชาญได้สร้างเช่น WordNet[upper-alpha 2][9]ผู้เชี่ยวชาญชาวเยอรมันคู่หนึ่งได้สร้างขั้นตอนวิธีเพื่อระบุความสัมพันธ์ระหว่างคำต่าง ๆ โดยตรวจแวะผ่านวิกิพีเดียอังกฤษอาศัยการจัดหมวดหมู่ของบทความ แล้วสรุปว่า วิกิพีเดียได้สร้าง "อนุกรมวิธานที่สามารถแข่งขันกับ WordNet ในงานประมวลผลทางภาษา"[10]

ใกล้เคียง

งานศึกษาวิกิพีเดียทางวิชาการ งานศึกษามีกลุ่มควบคุม งานศึกษาตามยาว งานศึกษาแบบสังเกต งานศึกษาตามรุ่นย้อนหลัง งานศึกษาตามขวาง งานศึกษาตามรุ่นตามแผน งานศึกษาควบคุมด้วยการรักษาหลอก งานศึกษาแบบอำพรางสองฝ่าย งานศึกษาแบบ meta-analysis

แหล่งที่มา

WikiPedia: งานศึกษาวิกิพีเดียทางวิชาการ http://www.americanhistoryprojects.com/downloads/J... http://zerogeography.blogspot.com/2009/11/mapping-... http://www.ft.com/intl/cms/s/0/97170c1a-b96f-11e2-... http://wikipapers.referata.com //ssrn.com/abstract=2939146 http://www.time.com/time/business/article/0,8599,1... http://www.3sat.de/dynamic/sitegen/bin/sitegen.php... http://www.wiwiss.fu-berlin.de/en/fachbereich/bwl/... http://atlas.tk.informatik.tu-darmstadt.de/Publica... http://adsabs.harvard.edu/abs/2013NatSR...3E1801M