פורמט mbox

כיצד דואר אלקטרוני הלקוחות לאחסן דואר על הדיסק הקשיח שלך

הפורמט הנפוץ ביותר לאחסון של הודעות דואר הוא פורמט ה- mbox. MBOX מייצג את MailBOX. Mbox הוא קובץ יחיד המכיל הודעות אפס או יותר.

פורמט mbox

אם נשתמש בפורמט mbox כדי לאחסן הודעות דוא"ל, שמנו את כולם בקובץ אחד. זה יוצר קובץ טקסט ארוך או פחות (דוא"ל אינטרנט תמיד קיים רק כטקסט ASCII של 7 סיביות, כל השאר - קבצים מצורפים, לדוגמה - מקודד ) המכיל הודעת אימייל אחת לאחר השנייה. איך אנחנו יודעים איפה נגמרת ואחת מתחילה?

למרבה המזל, כל דוא"ל יש לפחות אחד מתוך שורת בתחילת מאוד שלה. כל הודעה מתחילה עם "מאת" (מ ואחריו תו רווח לבן, המכונה גם "From_" שורה). אם רצף זה ("מאת") בתחילת שורה קודמת בשורה ריקה או בחלק העליון של הקובץ, מצאנו את תחילתה של הודעה.

אז מה שאנחנו מחפשים כאשר ניתוח קובץ mbox הוא, למעשה, שורה ריקה ואחריו "מ".

כביטוי רגיל, אנו יכולים לכתוב את זה כ- "\ n \ n ממקום. \ N". רק המסר הראשון הוא שונה. זה מתחיל רק עם "מ" בתחילת השורה ("^ מ. * \ N").

& # 34; מאת & # 34; בתוך הגוף

מה אם בדיוק את הרצף לעיל מופיע בגוף הודעת דוא"ל? מה אם החלק הבא הוא חלק מדוא"ל?

... אני שולח לך את הדוח האחרון.

מדוח זה, אינך צריך ...

הנה, יש לנו שורה ריקה ואחריו "מ" בתחילת השורה. אם זה מופיע בקובץ mbox, אין ספק שיש לנו התחלה של הודעה חדשה. לפחות זה מה שהמנתח חושב - ומדוע גם לקוח הדוא"ל וגם אנחנו נהיה מבולבלים למדי על ידי הודעת אימייל שמכילה לא שולח או נמען, אלא מתחילה ב "מתוך דוח זה".

כדי למנוע תנאים אסון כזה, אנחנו צריכים לוודא "מ" לא מופיע בתחילת שורה אחרי שורה ריקה בגוף של הודעת דוא"ל.

בכל פעם שאנו מוסיפים הודעה חדשה לקובץ mbox , אנו מחפשים רצפים כאלה בגוף פשוט להחליף "מ" עם "> מ". זה עושה פרשנויות מוטעות בלתי אפשרי. הדוגמה שלמעלה נראית כעת כך ולא מפעילה את המנתח:

... אני שולח לך את הדוח האחרון.

> מתוך דוח זה, אתה לא צריך ...

זו הסיבה שאתה עשוי למצוא לפעמים "> מאת" בדוא"ל שבו אתה מצפה רק "מ".