Morfix Search – לחפש ולמצוא!
Morfix Search (חיפוש מורפיקס) הוא תוסף תוכנה (פלאגין) מורפולוגי חכם שמתחבר למנוע החיפוש הארגוני, עוזר לו להתגבר על בעיות השפה (בעברית, ערבית ופרסית) ומשפר משמעותית את האיכות והדיוק של תוצאות החיפוש.
ארגונים היום עשירים בתכנים רבים בפורמטים דיגיטליים שונים. מנוע חיפוש הנמצא בשימוש הארגון אמור לעזור למשתמשים או לגולשים של הארגון להגיע במהירות למידע המבוקש, אבל מה יקרה כאשר המחפש יקליד בשורת החיפוש:
את מילת החיפוש בהטיה שונה מזו שמופיעה בתוכן של הארגון
מילה נרדפת למילת מפתח קיימת, ביטוי או מילה להם יש מספר משמעויות
את מילת החיפוש בכתיב מלא/חסר, את מילת החיפוש בכתיב חלופי
את מילת החיפוש בעברית כאשר בתוכן של הארגון המילה מופיעה באנגלית
ועוד ועוד אינסוף חלופות והטיות…
בכל המקרים האלה מנוע החיפוש, שלא יודע לזהות את הכוונה של המשתמש, לא יציג אף לא תוצאה אחת רלוונטית, למרות שהמידע מאוד רלוונטי עבור המחפש!
המשמעות היא פספוס של לקוח פוטנציאלי שיכול לחשוב בטעות שאין את המוצר או השירות שהוא חיפש, ויבחר להמשיך לחפש במקום אחר. או בזבוז זמן יקר של עובד הארגון במציאת התוכן אותו הוא מחפש
כיצד פועל החיפוש החכם של מלינגו בשפות שמיות (עברית וערבית)
מוצר החיפוש החכם המורפולוגי של מלינגו בעברית וערבית מתממשק למערכות האינדוקס והאחזור של כל מנועי החיפוש החשובים בשוק, כגון – Lucene, Solr,, Elastic Search ,SharePoint, Attivio, Dt-Search ולבסיסי הנתונים השונים – MS SQL Server, Oracle וכו'.
המוצר משתלב בתהליך האינדוקס ומבצע ניתוח מדויק של כל מילה בטקסט על בסיס הקשר, הרכיב מנרמל את המילים לצורת היסוד שלהם תוך ניתוח ההקשר בו המילה מופיעה.
למשל, המילים: אישה, נשים, אישתי ,ואשתי, כשנשותינו, וכו', כולן ינורמלו לאותה צורת יסוד. במקרה של "נשים", על המנוע להחליט האם מדובר ב"אשה" או בפועל "לשים" וההחלטה תבוצע על ידי Morfix Search על פי ההקשר של המילה בטקסט. האינדקס שנבנה הוא אינדקס מנורמל הכולל את הטקסט המקורי בצירוף צורת היסוד.
בזמן השאילתה מילות החיפוש מנותחות מורפולוגית על פי הקשר, כמו בתהליך האינדוקס, ותוצאת הניתוח היא ערך מנורמל אשר מופנה להשוואה מול האינדקס המנורמל.כתוצאה מכך חיפוש המילה "אישה" יחזיר לא רק תוצאות המכילות את המילה "אישה", אלא גם תוצאות המכילות את כל הטיותיה – "נשים", "אישתו", "נשותיו" וכו'.
בכל שאלה או בקשה להדגמה ניתן ליצור עימנו קשר
מאפייני החיפוש החכם של מלינגו

התגברות על רב-משמעות
בשפות שמיות קיימים מקרים רבים של מילים הכתובות באופן זהה אך הן בעלות משמעות שונה לחלוטין זו מזו. Morfix Search מתגבר על הרב-משמעות הזו. למשל, ביצוע שאילתה של המילה "פיצה" (Pizza) – יאחזר מסמכים המכילים את הרצף "טעימה יותר מפיצה רגילה" אבל לא יחזיר מסמכים המכילים את הרצף "היא מפיצה מורשית של המוצר".

חיפוש לפי צליל – סאונדקס
מאפשר חיפוש לפי צליל מילת החיפוש, רלוונטי במיוחד בחיפוש של שמות – חיפוש השם "אוורבוך" יחזיר גם "אברבוך". חיפוש "מזדה" יחזיר גם "מאזדה".

חיפוש לפי שורש ומשפחה סמנטית - חיפוש מורחב
מאפשר זיהוי של מילים שאינן הטיות של אותה צורת יסוד, אך חולקות את אותו השורש ויש ביניהן קשר סמנטי. שאילתה של המילה "עיתון" יאחזר גם "עיתונות", "עיתונאים" ו"עיתונים".

תמיכה בחיפושי קרבה
תומך בחיפושי קרבה כאשר אלו נתמכים ע"י מנוע החיפוש. חיפושי near נועדו לתת למשתמש לבצע שאילתה שכוללת מספר מילים תוך הגדרת מידת הקרבה בין המילים בטקסט שיימצא.

טיפול בפעלים
מסוגל לזהות את כל הנטיות של פעלים בכל הזמנים והבניינים, ובכך לאפשר החזרה של מסמכים המכילים את כל צורות הפועל. לדוגמה, שאילתה של הפועל "הלך" יחזיר גם את צורות הפועל "ילך", "הלכה", "הולכים" וכו'.

תמיכה בהיפוך מקלדת
במקרה ושפת המקלדת נמצאת בטעות באנגלית, חיפוש מורפיקס יבצע היפוך אוטומטי לעברית

תמיכה בתיקון טעויות
חיפוש מורפיקס מאפשר לשלב בתהליך החיפוש API של מלינגו לתיקון טעויות

ניתוח מורפולוגי מדויק
לכל מילה בטקסט מבוצע ניתוח מורפולוגי מדויק, כך שביצוע חיפוש של המילה "רופא" יאחזר מסמכים המכילים את המילים "רופאים", "ורופאיהם", "ולרופאי", כלומר יוחזרו מסמכים המכילים את כל ההטיות האפשריות.

תמיכה בחיפוש מכוון שמות
מאפשר דיוק רב יותר בעת חיפוש שמות. החיפוש הרגיל "ברק" יאחזר תוצאות הכוללות הטיות של המילה "ברקים", "הברק" וכו'. אך המערכת מאפשרת לבצע חיפוש שמות ממוקד של השם "ברק" ולאחזר תוצאות בהן מדובר בשם בלבד. שימוש באפשרות זו יחזיר תוצאות המכילות את המחרוזות "ברק", "ושברק" אך לא "הברקים" וכו'.

טיפול בכתיבים חלופיים
בעברית יש מקרים רבים של כתיבים חלופיים, למשל המילה "מוסיקה" יכולה להיכתב גם "מוזיקה", "תפישה" – "תפיסה" ועוד. Morfix Search מאפשר למנוע החיפוש להחזיר תוצאות בכתיבים השונים.

סימון מילות החיפוש בתוצאות
מאפשר סימון של מילות השאילתה בתוצאות החיפוש כולל כל ההטיות, מילים נרדפות וכו'.

תמיכה בצירופי מילים
תומך בהטיות של צירופי מילים. למשל חיפוש הצירוף "עורך דין" יחזיר תוצאות המכילות את ההטיות המורפולוגיות של הביטוי כפי שנמצאו במאגר הטקסט – "ועורכי דין" , "עורך הדין", "עורכי דינם" וכו'.

חיפוש הכולל תזאורוס
מאפשר זיהוי עשיר של מילים נרדפות, על הטיותיהן. זוהי יכולת המבוססת על מילונים המזהים זהויות אלו באופן אוטומטי. באופן זה ביצוע שאילתה של המילה "מסוק" יאחזר גם "הליקופטר", "מסוקם", "ההליקופטרים" וכו'. כולל האפשרות לטעינת מילון מילים נרדפות ארגוני מורפולוגי

תמיכה בחיפוש דו לשוני עברי אנגלי או ערבי אנגלי
חיפוש המילה בעברית יאחזר גם את תרגום המילה באנגלית אם היא נמצאת בטקסט, ולהיפך. למשל חיפוש המילה "נייד" יאחזר גם "Mobile" במידה וקיים
הרצאה על חיפוש חכם וניתוח טקסט בכנס ניהול ידע 2015
מציג: אמיר שלום, מנכ"ל מלינגו בע"מ
מצגת ההרצאה
דוגמה לפעילות רכיב ה-Morfix Search
בדוגמה הבאה בוצעה שאילתה של המילה "וירוס" באתר "ויקיפדיה" בפעם הראשונה בוצעה השאילתה ללא שימוש ברכיב המורפולוגי, ובפעם השנייה עם שימוש ברכיב המורפולוגי של מלינגו.
ללא שימוש ב Morfix Search
בדוגמה זו, ניתן לראות שהתקבלו 137 תוצאות המכילות את המחרוזת "וירוס" בלבד. תוצאות המכילות הטיות של המילה "וירוס" אינן מוחזרות.