ลูซีน

ลูซีน (Lucene) เป็นซอฟต์แวร์เสรีและซอฟต์แวร์โอเพนซอร์สสำหรับใช้เป็นส่วนต่อประสานโปรแกรมประยุกต์ในการค้นคืนสารสนเทศ แต่เดิมลูซีนถูกเขียนขึ้นโดยใช้ภาษาจาวา โดย Doug Cutting ซึ่งสนับสนุนโดยมูลนิธิซอฟต์แวร์อาแพชี และเผยแพร่โดยใช้สัญญาอนุญาตซอฟต์แวร์อาแพชี ลูซีนถูกย้ายไปเขียนขึ้นด้วยภาษาอื่น ๆ นอกจากภาษาจาวาด้วย ได้แก่ ภาษาเพิร์ล ภาษาซีชาร์ป ภาษาซีพลัสพลัส ภาษาไพทอน ภาษารูบี้ และภาษาพีเอชพีลูซีนเหมาะกับการใช้งานใดที่ต้องการการสร้างดัชนีข้อความอย่างเต็มรูปแบบ (Full-text indexing) และความสามารถในการค้นคืนข้อความแบบเต็มรูปแบบ (Full-text searching) ลูซีนได้รับการยอมรับอย่างกว้างขวางในการนำไปใช้สร้างเครื่องมือช่วยค้นหาข้อมูลสำหรับอินเทอร์เน็ต หรือ ภายในองค์กร หรือ เฉพาะในเว็บไซต์เดียว ซึ่งบางครั้งก็มีผู้เข้าใจผิดว่าลูซีนเป็นเครื่องมือช่วยค้นหาข้อมูลเต็มรูปแบบ ที่มีเครื่องมือรวบรวมเว็บเพจ (Web crawler) และโปรแกรมแจงโครงสร้างภาษา HTML ด้วย ทั้งนี้โปรแกรมที่ใช้งานลูซีนจะต้องมีมีเครื่องมือรวบรวมเว็บเพจ (Web crawler) และโปรแกรมแจงโครงสร้างภาษา HTML โดยแยกออกจากลูซีนสิ่งที่อยู่ในแก่นของสถาปัตยกรรมเชิงตรรกะของลูซีนคือแนวคิดว่าเอกสารประกอบไปด้วยเขตข้อมูลของข้อความ ซึ่งทำให้ส่วนต่อประสานโปรแกรมประยุกต์ของลูซีนยืดหยุ่นพอที่จะไม่ขึ้นอยู่กับรูปแบบไฟล์ ข้อความจากไฟล์ในรูปแบบ PDF HTML เอกสารไมโครซอฟท์เวิร์ด และรูปแบบอื่น ๆ อีกมากมายสามารถนำมาสร้างดัชนีได้ตราบเท่าที่สามารถสกัดข้อความจากเอกสารได้

ลูซีน