Morfix Search

תוסף תוכנה (פלאגין) מורפולוגי שמתחבר למנוע החיפוש הארגוני, עוזר לו להתגבר על בעיות השפה (בעברית, ערבית ופרסית) ומשפר משמעותית את האיכות והדיוק של תוצאות החיפוש.

ארגונים היום עשירים בתכנים רבים בפורמטים דיגיטליים שונים.

מנוע חיפוש הנמצא בשימוש הארגון אמור לעזור למשתמשים או לגולשים של הארגון להגיע במהירות למידע המבוקש, אבל מה יקרה באשר במחפש יקליד בשורת החיפוש:

• את מילת החיפוש בהטיה שונה מזו שמופיעה בתוכן של הארגון
• מילה נרדפת למילת מפתח קיימת
• ביטוי או מילה עם להם יש מספר משמעויות
• את מילת החיפוש בכתיב מלא/חסר
• את מילת החיפוש בכתיב חלופי
• את מילת החיפוש בעברית כאשר בתוכן של הארגון היא מופיעה באנגלית
• ועוד ועוד אינסוף חלופות והטיות…

בכל המקרים האלה מנוע החיפוש, שלא יודע לזהות את הכוונה של המשתמש, לא יציג אף לא תוצאה אחת רלוונטית, למרות שהמידע מאוד רלוונטי עבורו המחפש!

המשמעות היא פספוס של לקוח פוטנציאלי שיכול לחשוב בטעות שאין את המוצר או השירות שהוא חיפש, ויבחר להמשיך לחפש במקום אחר.

כך עובד Morfix Search

התוסף מנתח כל מילה בטקסט בשלב האינדוקס והשאילתה ובכך מאפשר להציג את כל התוצאות הרלוונטיות לכוונה של המשתמש, בהתאם להקשר של המילים בטקסט.

1. שלב האינדוקס של הטקסט באתר/במערכת ניהול הידע
התוסף משתלב בתהליך האינדוקס של המנוע, מנתח אותו ומוסיף לכל מילה רשומה של צורת המקור שלה (ID) בהתאם להקשר המילה בטקסט.
למשל, בביטוי "החרמון גבוה מהר מירון", המילה "מהר" תאונדקס תחת צורת המקור "הר"
ולא "מהר" (fast).

2. שלב החיפוש: המרת השאילתה לקוד צורת המקור
כשהמשתמש יקליד את הביטוי "הרים ידועים בישראל" המוצר ימיר את מילות החיפוש לקוד צורות המקור בהתאם להקשרן בשאילתא.

במקרה זה המילה "הרים" תומר לצורת המקור "הר" מה שיאפשר שליפה של טקסטים רלוונטיים, ובכלל זה "החרמון גבוה מהר מירון".

בכל שאלה או בקשה להדגמה ניתן ליצור עימנו קשר

מאפייני Morfix Search

חיפוש דו – לשוני עברי/אנגלי, ערבי/אנגלי

החיפוש המורפולוגי של מלינגו נותן מענה לסביבות טקסט המשלבות מגוון שפות (עברית/אנגלית/ערבית). לדוגמא – חיפוש המילה “נייד” יחזיר תוצאות בעברית (הנייד, ניידים וכו’) ובנוסף תוצאות באנגלית (Mobile) ולהיפך.

התגברות על רב-משמעות

בשפות שמיות קיימים מקרים רבים של מילים הכתובות באופן זהה אך הן בעלות משמעות שונה לחלוטין זו מזו. רכיב ה-Morfix Search של מלינגו מתגבר על הרב-משמעות הזו. למשל, ביצוע שאילתה של המילה "פיצה" (Pizza) – יאחזר מסמכים המכילים את הרצף "טעימה יותר מפיצה רגילה" אבל לא יחזיר מסמכים המכילים את הרצף "היא מפיצה מורשית של המוצר". כתוצאה מכך תוצאות החיפוש מדויקות יותר ואינן מכילות תוצאות לא רלוונטיות.

ניתוח מורפולוגי מדויק

לכל מילה בטקסט מבוצע ניתוח מורפולוגי מדויק, כך שביצוע חיפוש של המילה "רופא" יאחזר מסמכים המכילים את המילים "רופאים", "ורופאיהם", "ולרופאי", כלומר יוחזרו מסמכים המכילים את כל ההטיות האפשריות, בכל הזמנים ועם כל המוספיות, תוך התגברות על רב המשמעות, טיפול בכתיב מלא/חסר, טיפול בהטיות פעלים, טיפול בכתיבים חלופיים וסאונדקס .

חיפוש לפי צליל – סאונדקס

רכיב ה-Morfix Search  של מלינגו מאפשר חיפוש לפי צליל מילת החיפוש, הדבר רלוונטי במיוחד בחיפוש של שמות – חיפוש השם "אוורבוך" יחזיר גם תוצאאות המכילות את השם בכתיב שונה כגון – "אברבוך". חיפוש "מזדה" יחזיר גם תוצאות המכילות "מאזדה". יכולת זו כוללת תוספת מיוחדת לטיפול בשמות ממקור לא עברי, כמו ערבית ופרסית הכתובים באותיות עבריות.

חיפוש לפי שורש ומשפחה סמנטית - חיפוש מורחב

רכיב ה-Morfix Search  של מלינגו מאפשר זיהוי של מילים שאינן הטיות של אותה צורת יסוד, אך חולקות את אותו השורש ויש ביניהן קשר סמנטי. שימוש ביכולת החיפוש המורחב, מאפשר למשל שביצוע שאילתה של המילה "עיתון" יאחזר גם תוצאות המכילות את המילה "עיתונות", "עיתונאים" ו"עיתונים". ביצוע חיפוש של המילה "צילום" יאחזר גם תוצאות המכילות את המילה "צלמים" ו"במצלמה". החיפוש המורחב ניתן לשליטה על ידי המשתמש ובהתאם לצורכי הלקוח.

טיפול בפעלים

רכיב ה-Morfix Search  של מלינגו מסוגל לזהות את כל הנטיות של פעלים בכל הזמנים והבניינים, ובכך לאפשר החזרה של מסמכים המכילים את כל צורות הפועל. לדוגמה, ביצוע שאילתה של הפועל "הלך" יחזיר גם תוצאות המכילות את צורות הפועל "ילך", "הלכה", "הולכים" וכו'.

טיפול בכתיב מלא/חסר

רכיב ה-Morfix Search  של מלינגו מסוגל לבצע המרה בין כתיב חסר וכתיב מלא. כתוצאה מכך בעת ביצוע שאילתה של הצירוף "מזג אויר" יוחזרו גם מסמכים המכילים את הצירוף "מזג אוויר" או "מיזוג אוויר" וכו'.

תמיכה בחיפוש מכוון שמות

רכיב ה- Morfix Search מאפשר דיוק רב יותר בעת חיפוש שמות. החיפוש הרגיל "ברק" יאחזר תוצאות הכוללות הטיות של המילה "ברקים", "הברק" וכו'. אך המערכת מאפשרת לבצע חיפוש שמות ממוקד (בשליטת המשתמש) של השם "ברק" ולאחזר תוצאות בהן מדובר בשם בלבד. שימוש באפשרות זו יחזיר תוצאות המכילות את המחרוזות "ברק", "ושברק" אך לא "הברקים" וכו'. כמו כן, תהיה הרחבת מצלול לשם.

טיפול בכתיבים חלופיים

בעברית יש מקרים  רבים של כתיבים חלופיים,  למשל המילה "מוסיקה" יכולה להיכתב גם "מוזיקה", "תפישה" – "תפיסה" ועוד. רכיב ה-Morfix Search  של מלינגו מאפשר למנוע החיפוש להחזיר תוצאות בכתיבים השונים.

סימון מילות החיפוש בתוצאות

רכיב ה-Morfix Search  של מלינגו מאפשר סימון של מילות השאילתה בתוצאות החיפוש כולל כל ההטיות, מילים נרדפות וכו'.

תמיכה בצירופי מילים

רכיב ה-Morfix Search  של מלינגו תומך בהטיות של צירופי מילים. למשל חיפוש הצירוף "עורך דין" יחזיר תוצאות המכילות את ההטיות המורפולוגיות של הביטוי כפי שנמצאו  במאגר הטקסט – "ועורכי דין" , "עורך הדין", "עורכי דינם" וכו'. חיפוש "בית ספר" יחזיר גם תוצאות המכילות את הצירוף "ולבתי הספר" וכו'.

תמיכה בחיפושי קרבה

רכיב ה-Morfix Search  של מלינגו תומך בחיפושי קרבה כאשר אלו נתמכים ע"י מנוע החיפוש. חיפושי near נועדו לתת למשתמש לבצע שאילתה שכוללת מספר מילים תוך הגדרת מידת הקרבה בין המילים בטקסט שיימצא.

חיפוש הכולל תזאורוס

רכיב ה-Morfix Search  של מלינגו מאפשר זיהוי עשיר של מילים נרדפות, על הטיותיהן. זוהי יכולת המבוססת על מילונים המזהים זהויות אלו באופן אוטומטי. באופן זה ביצוע שאילתה של המילה "מסוק" יאחזר גם תוצאות המכילות טת המילים "הליקופטר", "מסוקם", "ההליקופטרים" וכו'.

 כלומר, חיפוש הכולל תזאורוס מאפשר למשתמש להגדיל את מרחב התוצאות שלו במילים נרדפות, על כל הטיותיהן המורפולוגיות, זאת מבלי לוותר על תוצאות החיפוש המורפולוגי הרגיל.

המוצר אף מאפשר להרחיב את מילון הנרדפות על ידי שילוב מילון משתמש המותאם לצרכי הלקוח ולאופי הטקסטים שבהם מבוצע החיפוש.

היפוך מקלדת

היפוך אותיות אוטומטי, במקרה ונבחרת שפת מקלדת שגויה

הרצאה על חיפוש חכם וניתוח טקסט בכנס ניהול ידע 2015

מציג: אמיר ש��ום, מנכ"ל מלינגו בע"מ

מצגת ההרצאה

דוגמה לפעילות רכיב ה-Concept Search

בדוגמה הבאה בוצעה שאילתה של המילה "וירוס" באתר "ויקיפדיה" בפעם הראשונה בוצעה השאילתה ללא שימוש ברכיב המורפולוגי, ובפעם השנייה עם שימוש ברכיב המורפולוגי של מלינגו.

ללא שימוש ב Concept Search

בדוגמה זו,  ניתן לראות שהתקבלו 137 תוצאות המכילות את המחרוזת "וירוס" בלבד. תוצאות המכילות הטיות של המילה "וירוס" אינן מוחזרות.

עם שימוש ב- Concept Search

בדוגמה זו, ניתן לראות שהתקבלו 603 תוצאות המכילות את המחרוזת "וירוס" אך גם את המחרוזות "נגיף", "הנגיף", "הויראלי", "בווירוס" ו-"בווירוס" שמאוד רלוונטיות למשתמש.

מלינגו ברשתות החברתיות

בין לקוחותינו

. דילוג לתוכן