ⓘ Мэдээлэл гаргаж авах

Hadoop

Техник технологийн хурдацтай хөгжиж буй өнөө үед цаг, минут тутамд асар их өгөгдлүүд шинээр үүсэж байна. 2000 онд компьютерийн хатуу дискний дундаж хэмжээ 10КВ байсан бол өнөөдөр фейсбүүкд өдөрт шинээр 500ТВ өгөгдөл нэмэгдэж байна. Боинг 737 онгоц Америкийн Нэгдсэн улсын дээгүүр нэг удаа нислэг үйлдэхэд 240 ТВ хэмжээтэй өгөгдөл үүсдэг байна. 2013 оны байдлаар дэлхий дээрх нийт өгөгдлийн 90 хувь нь сүүлийн 2 жилийн дотор бий болсон байдаг ба үүний 70 хувийг ямар нэгэн аж ахуйн нэгж, байгууллага биш харин хувь хүн бий болгосон гэсэн судалгааг IBM-ээс гаргажээ. Иймээс асар их өгөгдлийг зөв ар ...

Мэдээллийн бичмэл эх сурвалжууд

Мэдээллийн бичмэл эх сурвалжууд. Мэдээллийн хамгийн баталгаатай эх сурвалж бол бичмэл эх сурвалж байдаг бөгөөд үүнд бүх төрлийн баримт бичиг, тогтмол хэвлэлийн хайчилбар, радио, телевизийн нэвтрүүлгийн хуулбар зэрэг бичмэл зүйл багтдаг. Тэдний дотор дараах бичмэл эх сурвалжийг сэтгүүлчид хамгийн түгээмэл ашигладаг байна. Энэ нь: Засаглалын байгууллагуудын эх сурвалжууд буюу хэвлэгдэн гарсан бүх төрлийн статистик тоо баримт, тайлан, албан ёсны мэдээллүүд, УИХ, Засгийн газар, янз бүрийн агентлагууд, нэгж байгууллагуудын дотоод баримт бичгүүд, Засгийн газрын холбогдох хүмүүсийн илтгэл, хэлсэн ...

Компьютер

Компьютер эсвэл Тооцоолуур гэдэг нь нэг буюу хэд хэдэн төв процессор өгөгдсөн заавар буюу програмын дагуу өөрийн системийн төхөөрөмжүүдтэй мэдээлэл дамжуулах шугамуудаар харилцаж, мэдээллийг солилцох ба боловсруулан, тэдгээрийн үйл ажиллагааг удирдах цогц байгууламж юм. Компьютер нь маш олон дүрс, хэлбэрээр байдаг. Орчин үеийн компьютертой төстэй төхөөрөмжүүд нь 20-р зууны дунд үед 1940 - 1941 оны үе гарсан боловч компьютер гэдэг ухагдахуун ба компьютертой төстэй машинууд урьд нь байсан. Анхны цахилгаан компьютерууд нь бүтэн өрөөг дүүргэхээр хэмжээтэй байсан ба энэ нь хэдэн зуун персонал к ...

Routing information protocol version 1.2

rip ажиллагаа: зураг 2.2 харна уу Rip тохиргоо: RIPv2 – ийг ажиллуулахын тулд RIP тохиргооны горим дээр version гэсэн командын тусламжтайгаар гүйцэтгэнэ.Ингэснээр бүх шинэчлэлийн мэдээлэл subnet маскийг агуулна. RIPv2 – ийг тохируулсан рутер зөвхөн RIPv2 шинэчлэлийн мэдээллийг л хүлээн авах болон дамжуулдаг. Мөн RIPv1 дээр version командыг ашигласан бол дээрхтэй ижил байх ба version команд ашиглаагүй үед RIPv1 болон RIPv2 мэдээллийг хүлээн авч ойлгох боловч RIPv2 мэдээллийг нь тэр зуур устгадаг. Default-аар RIPv2 нь мөн RIPv1 – тэй адил хаягийг товчлох буюу classful хэлбэрт шилжүүлдэг. Үүн ...

Hotspot сервер

Hotspot-ийг анх утасгүй дотоод сүлжээ 1993 оны наймдугаар сард Сан Франциско хотод Moscone төвийн NetWorld бага хурал дээр Henrik Sjödin санал болгон гаргаж ирсэн байна. Hotspot нь хэрэглэгчийн таних хэлбэр дээр суурилсан сүлжээний эх үүсвэрүүдэд хандах боломжийг олгодог сүлжээний хандалтын арга юм.Hotspot нь интернетэд хандах public хандалт гэж ойлгож болно.Интернэтэд үнэгүй холбогдох бүс бөгөөд энэхүү бүсийг Hotspot гэж нэрлэдэг.Hotspot бүсийг бий болгох нь одоогийн бизнесийн байгууллагуудын үйлчилгээнийх нь нэгээхэн хэсэг болж хөгжсөөр байна.Wifi-ийн нэг дутагдал нь хэрэглэгч зөвхөн тух ...

График дизайн

График дизайн гэдэг нь дүрс, үсэг, орон зай ашиглан утга санааг илэрхийлэх, асуудлыг шийдвэрлэх ажиллагаа юм. График дизайныг дүрслэх урлаг, харилцаа холбооны салбарт хамааруулан авч үздэг. График дизайн нь лого, брэндбүүк гаргах, ном, сэтгүүл гэх мэт хэвлэлийн эх бэлтгэх, сурталчилгааны хуудас, зарлал, самбар, вэбсайтын график, элемент, тэмдэг, пиктографик, сав, баглаа боодол, орчны засал бүтээхэд шаардлагатай байдаг. Жишээлбэл бүтээгдэхүүний баглаа боодол нь компаний лого, чимэглэх зураг, үг, текст болон өнгө, дүрс гэх мэт геометрын дүрсүүдээс бүтдэг. Эдгээрийг хооронд нь уялдуулах нь гр ...

                                     

ⓘ Мэдээлэл гаргаж авах

Мэдээлэл гаргаж авах гэдэг бол мэдээллийн нөөцийн цуглуулгаас шаардагдах мэдээлэлтэй хамааралтай мэдээллийн нөөцийг олж авах үйл ажиллагаа юм. Хайлт нь бүтэн бичвэр эсвэл бусад агуулгад суурилсан индексжүүлэлтэд суурилж болно. Мэдээлэл хайх гэдэг бол баримт бичиг хайх, баримт бичиг дотроос мэдээлэл хайх, түүнчлэн өгөгдөл, бичвэрэн өгөгдлийн хөмрөг, зураг, дуу мэтийг тайлбарласан мета өгөгдлийг хайх шинжлэх ухаан юм.

Мэдээлэл хайх автоматжуулсан системийг мэдээллийн халилтыг багасгахад ашигладаг. Олон их сургууль, нийтийн номын сан IR буюу мэдээлэл хайх системийг ашиглан ном, сэтгүүл болон бусад баримт бичгийг хэрэглэх боломжоор хангадаг.

                                     

1. Тойм

Хэрэглэгчээс систем рүү квери англ. query оруулснаар мэдээлэл хайх үйл явц эхэлдэг. Квери гэдэг бол вэб хайлтын системд байдаг тэмдэгт мөр буюу стринг шиг шаардлагатай мэдээлэлд зориулсан албан мэдэгдэл юм. Квери нь тухайн цуглуулга дотроос цор ганц объектийг таньж олдоггүй. Харин тухайн кверитэй хамаарлын ялгаатай түвшнүүдэд таарах олон объектийг олох боломжтой.

Объект гэдэг бол агуулгын цуглуулга буюу өгөгдлийн хөмрөг дотор буй мэдээллээр төлөөлөгдсөн энтити юм. Хэрэглэгчийн квери нь өгөгдлийн хөмрөгийн мэдээлэлтэй харьцуулагдана. Гэвч өгөгдлийн хөмрөгийн сонгодог SQL кверитэй харьцуулахад мэдээлэл хайлтын үр дүн кверитэй таарах албагүй учир үр дүн нь ихэвчлэн чансаагаараа эрэмбэлэгдсэн байдаг. Энэхүү чансаа нь өгөгдлийн хөмрөгийн хайлт болон мэдээлэл хайлтын хоорондох гол ялгаа юм.

Хэрэглээнээс хамааран өгөгдлийн объект нь баримт бичиг, зураг, аудио, оюуны зураглал, видео гэх мэт олон янз байж болно. Баримт бичгүүдийг ихэвчлэн мэдээлэл хайлтын системд шууд хадгалдаггүй. Харин баримт бичгийн орлуулга буюу мета өгөгдлөөр төлөөлүүлсөн байдаг.

Ихэнх мэдээлэл хайлтын систем тухайн өгөгдлийн хөмрөг доторх объект бүр тухайн кверитэй хэр сайн таарч байгаад оноо өгч тооцоолдог. Топ чансаатай объектуудыг хэрэглэгчид харуулна. Хэрэв хэрэглэгч кверигээ боловсронгуй болгохыг хүсвэл дээрх үйл явцыг дахин давтана.

                                     

2. Загварын төрлүүд

Мэдээлэл хайлтын стратегиудыг ашиглан хамааралтай баримт бичгүүдийг үр нөлөөтэйгөөр хайхын тулд тухайн баримт бичгүүдийг ихэвчлэн зохих төлөөлөл рүү нь хувиргадаг. Хайлтын стратеги бүр өөрийнхөө баримт бичгийг төлөөлөх зорилгоор тодорхой загварыг өөртөө хамруулдаг. Баруун талд байгаа зурагт зарим нийтлэг загварыг харуулав. Зурагт буй загваруудыг дараах хоёр хэмжээсээр айжуулав: математикийн суурь ба тухайн загварын шинж чанар.

                                     

3. Нэмж унших

  • Ricardo Baeza-Yates, Berthier Ribeiro-Neto. Modern Information Retrieval: The Concepts and Technology behind Search second edition. Addison-Wesley, UK, 2011.
  • Christopher D. Manning, Prabhakar Raghavan, and Hinrich Schütze. Introduction to Information Retrieval. Cambridge University Press, 2008.
  • Stefan Büttcher, Charles L. A. Clarke, and Gordon V. Cormack. Information Retrieval: Implementing and Evaluating Search Engines. MIT Press, Cambridge, Mass., 2010.
                                     

4. Цахим холбоос

  • TREC report on information retrieval evaluation techniques
  • Information Retrieval DUTH
  • Information Retrieval Facility
  • Text Retrieval Conference TREC
  • ACM SIGIR: Information Retrieval Special Interest Group
  • How eBay measures search relevance
  • Forum for Information Retrieval Evaluation FIRE
  • Information Retrieval Wiki
  • BCS IRSG: British Computer Society - Information Retrieval Specialist Group
  • Information retrieval performance evaluation tool Athena Research Centre
  • Information Retrieval online book by C. J. van Rijsbergen
                                     
  • өгөгдлийг баталгаажуулах мэдээлэл итгэж болохуйц үнэн байж чадах ба түүнийг хангалттай сайн гэж үзэж болно хүлээн авах процес Мэдээллийг хүлээн авагч
  • нэгтгэн дүгнэх, задлан шинжлэх аргаар мэдээлэл гаргаж авах цаашид шийдвэр гаргах төвшний мэдлэгийг гаргаж авах тусам түүний үнэ цэнэ өсөж байна. Эндээс
  • Фермерүүдийн хувь холбоо харилцаа нь цаг агаарын мэдээлэл эдийн засаг зах зээлийн тойм мэдээлэл авах зэргээр ач холбогдол өндөр болсон. Фермийн менежментийг
  • байсных нь илрэл тухайн үед шийдэж чадаагүй байсан куб язгуур авах үйлдлийг томъёолон гаргаж баталсан явдал юм. Үүнийг шийдэж чадснаар галт бөмбөг шиддэг
  • стратеги нь хувь хүмүүс шаардлагатай мэдлэг олж авах хүсэлтээ тухайн чиглэлээр ажилладаг экспертэд гаргаж эксперт нь шаардлагатай хүмүүст өөрийн үзэл бодлоо
  • хувиргаж бага хэмжээний тоон хэлбэрийн мэдээлэл гаргаж авна. Гэвч хэйш кодоос жинхэнэ мэдээллийг буцаан гаргаж авах боломжгүй байдаг ба ийм төрлийн алгоритмуудыг
  • дөрвөн хэлээр сонин сэтгүүл эрхлэн гаргаж дэлхийн улс орнуудад мэдээлэл түгээхийн зэрэгцээ найман хэлээр мэдээлэл хүлээн авч улс орны дотоодод дамжуулж
  • гарган авах боломжтой. Сургалтын менежер Системд бүх багш, сурагчдын бүртгэлтэй ажиллах болон хичээлийн хуваарь оруулах, сурагчдын ирц, дүнгийн мэдээлэл харах
  • зэргийг мэдэж авах боломжтой. Мөн Төрийн хянан шалгах, аудитын байгууллагын шалгалтын дүнгийн талаарх тайлан, гишүүдийн хийсэн мэдээлэл өгсөн ярилцлага
  • тавьж 1988 онд тусгайд авч хэлэлцэн ПДС - ийн талаар авах арга хэмжээний тухай гэсэн тогтоол гаргаж байв. Сургуулийн материалаг баазын хөгжилд 1980 оны