הסר שורות כפולות של נתונים ב- Excel

Friday of 02

הסר רשומות נתונים כפולות ב- Excel

הסרת כפילויות - חיפוש רשומות זהות לפי שם שדה. © Ted French

תוכניות גיליון אלקטרוני כגון Excel משמשות לעתים קרובות כמסד נתונים לדברים כמו מלאי חלקים, רשומות מכירה ורשימות דיוור.

מאגרי הנתונים ב- Excel מורכבים מטבלאות נתונים המאורגנות בדרך כלל בשורות נתונים הנקראות רשומות.

ברשומה, הנתונים בכל תא או שדה בשורה קשורים - כגון שם החברה, הכתובת ומספר הטלפון.

בעיה נפוצה המתרחשת כאשר מסד נתונים גדל בגודל היא של רשומות כפולות או שורות נתונים.

שכפול זה יכול להתרחש אם:

כך או כך, רשומות כפולות יכולות לגרום למגוון שלם של בעיות - כגון שליחת מספר עותקים של מסמכים לאותו אדם, כאשר מידע מסד הנתונים משמש במיזוג דואר - לכן מומלץ לחפש ולסלק רשומות כפולות על בסיס קבוע בָּסִיס.

ובעוד קל לבחור רשומות כפולות במדגם קטן כמו זה בתמונה לעיל, טבלאות הנתונים יכול בקלות להכיל מאות אם לא אלפי רשומות מקשה מאוד לבחור רשומות כפולות - במיוחד התאמת חלקית רשומות.

כדי להקל על ביצוע משימה זו, ל- Excel יש כלי נתונים מובנה הנקרא, באופן לא מפתיע, הסרת כפילויות , אשר ניתן להשתמש בהם כדי למצוא ולהסיר רשומות זהות ומותאמות באופן חלקי.

עם זאת, האופן שבו הכלי ' כפילויות של כפילויות' מתוכנן, רשומות זהות ומותאמות חלקית חייבות להיות מטופלות בנפרד.

הסיבה לכך היא כי תיבת הדו-שיח ' הסר כפילויות ' מציגה את שמות השדות עבור טבלת הנתונים שנבחרה, ואתה בוחר אילו שדות לכלול בחיפוש אחר רשומות תואמות:

שמות שדות לעומת אותיות עמודות

כאמור, הכלי 'שכפל כפילויות' מורכב מתיבת דו-שיח שבה אתה בוחר אילו שדות תואמים לחיפוש באמצעות סימון השדות או השורות הרצויים.

המידע שמוצג בתיבת הדו-שיח - שמות שדות או אותיות עמודות - תלוי אם הנתונים שלך מכילים שורת כותרות - או כותרות - בחלק העליון של טבלת הנתונים, כפי שמוצג בתמונה למעלה.

אם זה עושה - ודא את האפשרות בצד ימין של תיבת הדו שיח - הנתונים שלי יש כותרות - מסומנת ו- Excel יציג את השמות בשורה זו כשמות שדות בתיבת הדו שיח.

אם הנתונים שלך אינם כוללים שורת כותרת, תיבת הדו-שיח תציג את אותיות העמודות המתאימות בתיבת הדו-שיח עבור טווח הנתונים שנבחר.

טווח רציף של נתונים

כדי שהכלי ' שכפל כפילויות' יפעל כהלכה, טבלת הנתונים חייבת להיות טווח רציף של נתונים - כלומר, אין לה שורות ריקות, עמודות, ואם בכלל אפשרי, אין תאים ריקים הנמצאים בטבלה.

אין צורך החסר בתוך טבלת נתונים הוא תרגול טוב כשמדובר ניהול נתונים בכלל ולא רק כאשר מחפשים נתונים כפולים. כלי הנתונים האחרים של Excel - כגון מיון וסינון - פועלים בצורה הטובה ביותר כאשר טבלת הנתונים היא טווח רציף של נתונים.

הסר שכפל נתונים רשומות דוגמה

בתמונה שלמעלה, טבלת הנתונים מכילה שתי רשומות זהות עבור A. Thompson ושני רשומות תואמות חלקית עבור R. Holt - שם כל השדות תואמים למעט מספר התלמיד.

השלבים המפורטים להלן מפרטים כיצד להשתמש בכלי ' הסר כפילויות נתונים' כדי:

  1. הסר את השני של שני רשומות זהים עבור א תומפסון.
  2. הסר את הרשומה השנייה תואמת חלקית עבור ר 'הולט.

פתיחת תיבת הדו-שיח ' הסר כפילויות'

  1. לחץ על כל תא המכיל נתונים במסד הנתונים לדוגמה.
  2. לחץ על הכרטיסייה נתונים על הסרט.
  3. לחץ על הסמל ' הסר כפילויות' כדי לסמן את כל הנתונים בטבלת הנתונים ולפתוח את תיבת הדו-שיח ' הסר כפילויות '.
  4. תיבת הדו-שיח ' הסר כפילויות ' מציגה את כל כותרות העמודות או שמות השדות מדוגמת הנתונים שלנו
  5. סימני הסימון שליד שמות השדות מציינים את העמודות ש- Excel ינסה להתאים בחיפוש אחר רשומות כפולות
  6. כברירת מחדל, כאשר תיבת הדו-שיח נפתחת כל שמות השדות מסומנים

מציאת רשומות זהות

  1. מכיוון שאנו מחפשים רשומות זהות לחלוטין בדוגמה זו, אנו נשאיר את כל כותרות העמודות מסומנות
  2. לחץ על אישור

בשלב זה את התוצאות הבאות יש לראות:

02 of 02

מצא ולהסיר חלקית עם רשומות משוכפלות הסר כפילויות

הסר כפילויות - מחפש רשומות תואמות חלקית לפי שם שדה. © Ted French

בדיקת שדה אחד בכל פעם

מאחר ש- Excel מסיר רק רשומות נתונים שמתאימות בדיוק לשדות הנתונים שנבחרו, הדרך הטובה ביותר למצוא את כל רשומות הנתונים התואמות חלקית היא להסיר את סימן הביקורת עבור שדה אחד בלבד בכל פעם, כפי שנעשה בשלבים הבאים.

חיפושים עוקבים אחר רשומות שמתאימות בכל השדות, למעט שם, גיל או תוכנית יסיר את כל השילובים האפשריים לרשומות תואמות באופן חלקי.

מציאת רשומות תואמות חלקית

  1. לחץ על כל תא המכיל נתונים בטבלת הנתונים במידת הצורך
  2. לחץ על הכרטיסייה נתונים על הסרט .
  3. לחץ על הסמל ' הסר כפילויות' כדי לסמן את כל הנתונים בטבלת הנתונים ולפתוח את תיבת הדו-שיח ' הסר כפילויות '.
  4. כל שמות השדות או כותרות העמודות בטבלת הנתונים נבחרו.
  5. כדי לאתר ולהסיר רשומות שאין להן התאמה בכל שדה, הסר את סימן הביקורת מעבר לשמות השדות שבהם Excel מתעלמת.
  6. בדוגמה זו, לחץ על תיבת הסימון שליד העמודה ' מזהה תלמיד' כדי להסיר את סימן הביקורת.
  7. Excel כעת רק לחפש ולהסיר רשומות שיש להם נתונים תואמים בשדות שם משפחה , ראשוני ותוכנית .
  8. לחץ על אישור
  9. תיבת הדו-שיח צריכה להיסגר ולהחליף בהודעה שאומרת: 1 ערכים כפולים נמצאו והוסרו; 6 ערכים ייחודיים נשארים.
  10. השורה המכילה את הרשומה השנייה עבור R. Holt עם מזהה התלמיד של ST348-252 יוסרו ממסד הנתונים.
  11. לחץ על אישור כדי לסגור את תיבת ההודעה

בשלב זה, טבלת הנתונים לדוגמה צריכה להיות ללא כל נתונים כפולים.