Semalt: מיצוי נתוני אינטרנט באמצעות תוסף גוגל כרום

אם אתה משתמש בדפדפן Google Chrome לגלישה ברשת, קיים תוסף דפדפן לחילוץ נתונים מדפי האינטרנט המועדפים עליך. Google Chrome Scraper היא תוכנה המשמשת לאחזור נתונים מאתרים דינמיים וסטטיים כאחד. תוסף Chrome זה יאפשר לך לגרד את התוכן המועדף עליך בדף האינטרנט ולשמור אותו ב- Google Docs.

מגרד האינטרנט של Chrome

מגרד האינטרנט של Chrome הוא הרחבת דפדפן המוציאה נתונים מאתרים ומדפים. עם התוסף הזה, אינך זקוק למאות עובדים כדי להעתיק ולהעתיק תוכן מאתרים כל היום. לאחר ההתקנה בדפדפן כרום, כל שעליכם לעשות הוא לבחור את תוכן היעד ולתת לגרד באינטרנט לבצע את השאר.

אם אין לך ידע בנושא קידוד, זהו מגרד האינטרנט הטוב ביותר שיש לקחת בחשבון. מגרד כרום של גוגל מומלץ לגריטות קטנות וגדולות כאחד. זה מורכב ממידע ונתונים בעלי ערך שניתן להפוך לנתוני מודיעין תחרותיים. עם סיומת זו, ניתן לחלץ ולייצא בקלות את כל תמונות היעד והספריות שלך ל- CouchDB או לגיליונות אלקטרוניים.

מדריכים כיצד להתחיל

גירוד דפי אינטרנט עם תוסף דפדפן הוא משימה של עשה זאת בעצמך שתוכל לבצע במהירות באמצעות המחשב האישי שלך. להלן מדריך אולטימטיבי שיעזור לכם להתחיל בעבודה:

  • הפעל את דפדפן Google Chrome ולחץ על "חנות האינטרנט של Chrome."
  • פתח את תוספי הדפדפן שלך וחפש "מגרד".
  • לחץ על האפשרות "הוסף לכרום" המוצגת על המסך שלך
  • פתח את האתר או את דף האינטרנט שיש לשרוט והדגש את הנתונים שאתה צריך לקבל. לחץ באמצעות לחצן העכבר הימני על הרכיב ולחץ על "גרד דומה".
  • מסך מגרד יופיע על המסך שלך. שים לב כי מסוף מגרד האינטרנט מורכב מהנתונים שחולצו.
  • בשלב זה אתה יכול להחליט היכן לשמור את התוכן הגרוט שלך. לדוגמה, אתה יכול לשמור את התוכן ב- Google Docs על ידי לחיצה על "שמור ב- Google Docs".

שים לב ש"גרד "הוא סקריפט אוטומטי המוציא נתונים שימושיים מדפי אתרים דינמיים. בשונה מכלי גירוד באינטרנט אחרים, מגרד האינטרנט של Chrome יכול גם לגרד נתונים שנוצרו באמצעות JavaScript. משימות אחרות שבוצעו על ידי תוסף מגרד Chrome כוללות:

  • לחיצה על כפתורי תוכן כדי לטעון נתונים;
  • לחיצה על כפתורי עימוד שמטענים מידע באמצעות AJAX;
  • גלילה מטה בדפי אינטרנט כדי לטעון יותר תוכן;
  • ממתין לטעינת תוכן דינמי בדף אינטרנט;

לאחר גירוד נתונים מדף אינטרנט, תוכלו להוריד את הנתונים בפורמט ערכים מופרדים בפסיקים (CSV) או לאחסן אותם ב- CouchDB. עם מגרד האינטרנט של Chrome, אינך צריך לעבוד על חילוץ נתונים, לתכנן בנייה או לייצא.