הטווח הדינאמי של 16 ביט והקלטה של תזמורת

  • פותח הנושא AK1
  • פורסם בתאריך

genvirt

חבר משקיען
הודעות
2,362
מעורבות
811
נקודות
113
אני שמח שייש לך דיעה כזו חשובה ותורמת.

אז אולי חלק מהאנשים קוראים בחלק מהאתרים, אבל ודאי שלא כולם כותבים בכל האתרים.

בינתיים עדיין לא מצאתי מי שיענה לי באופן ענייני לשאלות ששאלתי.
אל תיקח את זה כזה קשה:)
אילו יכלו להקליט ב20 bit כמינימום (והכי טוב ובטח מספיק ב24) - העניין של טיפול בdither היה מיותר ונעלם - אכן זה לא קשור לשאלתך גם:)
 

AK1

חבר משקיען
הודעות
11,926
מעורבות
2,941
נקודות
113
אילו יכלו להקליט ב20 bit כמינימום (והכי טוב ובטח מספיק ב24) - העניין של טיפול בdither היה מיותר ונעלם - אכן זה לא קשור לשאלתך גם:)
כיום כמעט תמיד מקליטים ב-24 ביט ומעלה, אבל הצורך ב-dithering וב-noise shaping נשאר כשמורידים ל-16 ביט לצורך השמעה
 

genvirt

חבר משקיען
הודעות
2,362
מעורבות
811
נקודות
113
כיום כמעט תמיד מקליטים ב-24 ביט ומעלה, אבל הצורך ב-dithering וב-noise shaping נשאר כשמורידים ל-16 ביט לצורך השמעה
מורידים ל16 לצורך השמעה? אולי אני מתבלבל בדבר, אך חברות מתאמצות להביא מכשירים שלהם לתמיכה בביטים ברמה גבוהה (32 ומעלה)...
 

AK1

חבר משקיען
הודעות
11,926
מעורבות
2,941
נקודות
113
מורידים ל16 לצורך השמעה? אולי אני מתבלבל בדבר, אך חברות מתאמצות להביא מכשירים שלהם לתמיכה בביטים ברמה גבוהה (32 ומעלה)...
התכוונתי לדיסקים ולקבצים באיכות CD, לא לפורמאטים של hi-res
 

genvirt

חבר משקיען
הודעות
2,362
מעורבות
811
נקודות
113
התכוונתי לדיסקים ולקבצים באיכות CD, לא לפורמאטים של hi-res
הבנתי
 

לני

חבר משקיען
הודעות
695
מעורבות
275
נקודות
63
כשמדברים על טווח דינאמי של מוזיקה, מדברים על ההפרש ב-dB SPL בין הקטע החזק ביותר לבין הקטע החלש ביותר. אם מדברים על הקלטות מודרניות של תזמורת, עם multi-miking, מדובר על העוצמות שקולטים המיקרופונים, יחסית קרוב לכלים, ולא על העוצמות ששומעים המאזינים באולם.

מצאתי מחקר שבו מדברים על העוצמות ששומעים בתוך התזמורת, ושם (Table 2) מדובר על פיקים קצת מעל 130dB. לא מצאתי מקור מוסמך שבו כתוב מה העוצמה ליד כלי בודד שמנגן הכי בשקט שאפשר באולם שקט, שזה אולי באיזור ה-50dB, אולי פחות. כך שהטווח הדינאמי בקירבת התזמורת הוא באיזור 80dB.

כשמדברים על הטווח הדינאמי של 16 ביט (CD) ב-dB, מדברים על 20*log (בסיס 10) של היחס בין הצליל החזק ביותר האפשרי (אמפליטודה המיוצגת ע"י ביט סימן ו-15 ביטים דלוקים=32,767, ויש הטוענים 16 ביטים דלוקים=65,535) לחלש ביותר האפשרי (ביט אחד דלוק=1), שזה dB 90.3 או dB 96.3, בהתאמה.

הבעייה כאן היא שהביט הבודד, שמייצג כביכול את הצליל החלש ביותר, אינו מספיק כדי לייצג מוזיקה אמיתית כלשהי המנוגנת בשקט ככל האפשר, ללא תלות בתדר הדגימה, כלומר שהטווח הדינאמי האמור של CD הוא במונחים תיאורטיים, לא במונחים של מוזיקה.

כדי לדבר במונחים של מוזיקה, צריך שהצליל החלש ביותר יכיל מספיק ביטים כדי שייצג איזשהו צליל מוזיקאלי אמיתי, שכולל הרמוניות -- צורת גל די מסובכת שצריך להיות מסוגלים לתאר אותה. אם נקצה לצליל החלש, באופן שרירותי, אפילו רק 5 ביטים, שנותנים לאמפליטודה רק 31 אפשרויות, זה מוריד מהטווח הדינאמי הכולל 20*log(31) שזה 29.8dB, ונשארים עבור מוזיקה עם 60.5dB או 66.5dB, בהתאמה, שזה לא מספיק להכלת הטווח הדינאמי בקירבת תזמורת מלאה.

ואם לא די בכך, יש את הבעייה של הצורך ב-headroom כטווח ביטחון בעת ההקלטה. כשמקליטים, יש צורך לכוון את הווליום של ה-analog-to-digital converter (ה-ADC) כך שהצליל החזק ביותר לא יגרום ל-overflow/truncation, אבל לא בטוח שבעת ההקלטה עצמה, התזמורת לא תנגן אפילו חזק יותר מאשר בעת הכיוון, כך שייש צורך להשאיר טווח ביטחון של כמה וכמה dB טובים, מה שמוריד עוד מהטווח הדינאמי הניתן להקלטה.

לכן עדיף להקליט ב-24 ביט, שאז הטווח הדינאמי גדול בהרבה: התיאורטי, לפי אותה שיטת חישוב, הוא 138.5dB או 144.5dB, וגם אם מורידים את ה-29.8dB האמורים נשארים עם 108.7dB שמספיקים לגמרי לתזמורת ולטווח ביטחון ולתיאור מלא של צורות גל מסובכות בווליומים נמוכים.

העניין הוא שעל כל זה חשבתי בעצמי -- לא לקחתי את זה משום מקור מוסמך כלשהו -- כך שייתכן שייש כאן הרבה דברים לא נכונים.

לפי הנאמר, יש בעייה לבצע הקלטה ב-16 bit של תזמורת בלי compression אנאלוגי(!) לפני הכניסה ל-ADC, כי הטווח הדינאמי של 16 ביט עבור מוזיקה אינו מספיק.

אז איפה הטעויות?

דיון מאוד מעניין....



1. אני חושב שאתה מערבב בין מישור הסאונד למישור המדידה.
יש בינהם מיקרופון שממיר את הקול למתח חשמלי.
שקט יהיה מן הסתם אפס וולט, עוצמה חזקה ביותר נניח 5 וולט.
עכשיו התחום דנמי הוא תלוי ב snr.
אם נניח שהרעש הוא 10 מיקרו וולט אז התחום הדינמי הוא:
Dr = 20xlog(5/10u) = 114.
אפשר לשפר את התחום הדינמי על ידי הוצאת מתח מקסימלי גדול יותר.
לדוגמא ב 30 וולט התחום הדנמי הוא 129db.

התחום הדנמי בעבור a2d מחושב לפי
DigitalDr= 20log(2^q)= 6.02×q

כאשר q מספר הביטים.
עבור 16 ביט נקבל תחום דנמי של 96.


במעבר ל16 ביט יש אלגוריטמים לדחיסה שמבוססים על תחום השמע של האוזן האנושית ומצמצמים את התחום של הרעש.

2. כול כלי מוקלט בנפרד לערוץ. אחר כך בשלב העריכה, כל ערוץ מונחת או מוגבר בנפרד ואחר כך מסכמים את כל הערוצים.

3. לדעתי ציוד הקלטות מיקצועי לא דוגם ב 16 ביט.
לפחות 24 אם לא 32.
 

AK1

חבר משקיען
הודעות
11,926
מעורבות
2,941
נקודות
113
1. אני חושב שאתה מערבב בין מישור הסאונד למישור המדידה.
מה זה "מישור הסאונד" שעומד מול "מישור המדידה"?

יש בינהם מיקרופון שממיר את הקול למתח חשמלי.
שקט יהיה מן הסתם אפס וולט, עוצמה חזקה ביותר נניח 5 וולט.
...
אפשר לשפר את התחום הדינמי על ידי הוצאת מתח מקסימלי גדול יותר.
לדוגמא ב 30 וולט התחום הדנמי הוא 129db.
אתה מכיר מיקרופונים שמוציאים 5 וולט? או 30 וולט? ושאיכשהו מבצעים "הוצאת מתח מקסימלי גדול יותר"?

עכשיו התחום דנמי הוא תלוי ב snr.
אם נניח שהרעש הוא 10 מיקרו וולט אז התחום הדינמי הוא:
Dr = 20xlog(5/10u) = 114.
אפשר לשפר את התחום הדינמי על ידי הוצאת מתח מקסימלי גדול יותר.
לדוגמא ב 30 וולט התחום הדנמי הוא 129db.
אתה מניח כל מיני מספרים באוויר ועושה עליהם חישובים באוויר, בלי שום קשר לאיזושהי מציאות.

2. כול כלי מוקלט בנפרד לערוץ. אחר כך בשלב העריכה, כל ערוץ מונחת או מוגבר בנפרד ואחר כך מסכמים את כל הערוצים.
אתה מדבר על זה כעל עובדה מוחלטת, אבל זה לא תמיד כך היום ובוודאי לא הייה כך בעבר, כשהקליטו מונו במיקרופון אחד וסטריאו בשניים או שלושה ערוצים.

ואם כבר אז מיקרופון לכל קבוצת כלים, ואין משמעות להנחתה/הגברה בנפרד, אלא להגברה/הנחתה יחסית בין ערוצים בשלב המיקס.

3. לדעתי ציוד הקלטות מיקצועי לא דוגם ב 16 ביט.
לפחות 24 אם לא 32.
ציוד מקצועי של היום לא דוגם ב-16 ביט, אבל במשך הרבה שנים לא הייה ציוד של יותר מ-16 ביט.

מה שמעניין אותי לדעת לגבי כל ההקלטות שכן בוצעו ב-16 ביט במהלך די הרבה השנים האלה: איך אפשר הייה להקליט תזמורות סימפוניות גדולות ללא compression אנאלוגי לפני הכניסה ל-ADC, והאם החברות שטענו שהקלטותיהן נעשו ללא EQ/compression בשום שלב, שיקרו.
 

לני

חבר משקיען
הודעות
695
מעורבות
275
נקודות
63
חשבתי להגיב לך שוב פעם.
אבל משאלה ששאלת הפכת את הדיון להתנצחות.
 

ליאור

חבר משקיען
הודעות
636
מעורבות
409
נקודות
63
ציוד מקצועי של היום לא דוגם ב-16 ביט, אבל במשך הרבה שנים לא הייה ציוד של יותר מ-16 ביט.

כן, אבל הקלטה דיגיטלית 'אמיתית' כלומר דגימת כלי הנגינה ברמת האולפן או אולם ההופעות, זה סיפור שהחל בערך בסוף ה 70 תחילת ה 80 (ואולי אני טועה בעשור לכאן או לכאן).
לפני זה (וגם די הרבה אחרי זה), הקליטו על טייפ אנלוגי כמובן, ושלב ה ADC נעשה מול הטייפ. לכן תמיד קיימת האפשרות לדגום את אותו טייפ (ככל שזה שרד את פגעי הזמן או לא נשרף כמו שקרה ליוניברסל הגאונים :rolleyes:) עבור הוצאה מחודשת ברזולוציה הרבה יותר עדכנית, ואפשר לשחרר מחדש את הקטעים עם טווח דינאמי תיאורתי יותר רחב, גם מבלי לגעת במיקס.

במאמר מוסגר, כבר לפני 24 שנה היה לי בבית ציוד הקלטה שדוגם מאנלוג גולמי ב 20 ביט, וזה ממש לא נחשב היה לציוד אקזוטי.
 

AK1

חבר משקיען
הודעות
11,926
מעורבות
2,941
נקודות
113
כן, אבל הקלטה דיגיטלית 'אמיתית' כלומר דגימת כלי הנגינה ברמת האולפן או אולם ההופעות, זה סיפור שהחל בערך בסוף ה 70 תחילת ה 80 (ואולי אני טועה בעשור לכאן או לכאן).
לפני זה (וגם די הרבה אחרי זה), הקליטו על טייפ אנלוגי כמובן, ושלב ה ADC נעשה מול הטייפ. לכן תמיד קיימת האפשרות לדגום את אותו טייפ (ככל שזה שרד את פגעי הזמן או לא נשרף כמו שקרה ליוניברסל הגאונים :rolleyes:) עבור הוצאה מחודשת ברזולוציה הרבה יותר עדכנית, ואפשר לשחרר מחדש את הקטעים עם טווח דינאמי תיאורתי יותר רחב, גם מבלי לגעת במיקס.

במאמר מוסגר, כבר לפני 24 שנה היה לי בבית ציוד הקלטה שדוגם מאנלוג גולמי ב 20 ביט, וזה ממש לא נחשב היה לציוד אקזוטי.
אכן יש הקלטות שנעשו גם אנאלוגית וגם דיגיטאלית ב-16/44 במקביל, ובמקרים האלה אפשר להשתמש בדיגיטאציה מודרנית של הסרטים האנאלוגיים, אם הם שרדו ומצבם טוב.

אבל הרבה מאוד הקלטות נעשו ב-16/44 ללא מקביל אנאלוגי, ואליהן אני מתייחס בשאלותי.
 

ליאור

חבר משקיען
הודעות
636
מעורבות
409
נקודות
63
לתיקון הקלטות אלה רק מכונת זמן תעזור.
 

AK1

חבר משקיען
הודעות
11,926
מעורבות
2,941
נקודות
113
לתיקון הקלטות אלה רק מכונת זמן תעזור.
בזמן האחרון יוצאים דיסקי Blu-ray עם upsampling של הקלטות כאלה ל-24/96 או 24/192.

אבל נושא הדיון אינו תיקון ההקלטות האלה, אלא האם השתמשו בקומפרסור אנאלוגי לפני ה-ADC, והאם בכלל הניתוח שלי של מה שקורה ב-16 ביט הוא נכון.
 

ליאור

חבר משקיען
הודעות
636
מעורבות
409
נקודות
63
קומפרסור אנאלוגי 'תוחם' את טווח התדרים למנעד מסויים, ואף משווה את העוצמות בין התדרים השונים (מגביר את העוצמה הנמוכה, בד"כ הגבוהים ביותר, ומנמיך את הסופר חזקים) או במילים אחרות מאבד מידע.
הקלטה גולמית של האות ברזולוציה נמוכה מאבדת מידע אף היא.
האינטואיציה אומרת שאם ממקמים את המיקרופונים (ויכולים להיות עשרות ואף למעלה מזה) בצורה מספיק טובה עם מרחקים נכונים ע"פ סוג הכלי, הסקשן בתזמורת ויתכן שאפילו ע"פ אופי היצירה עצמה, אפשר להשיג את אותו אפקט מבלי לערוך מניפולציה בקונסולה לפני הדגימה.

אגב, אני לא מבין מדוע אתה "חושד" דווקא במניפולציה אנלוגית ברמת המקור. באותה מידה אפשר לשער שמאחר וכל הסיגנלים הם דיגיטלים במקור, ניתן אלגוריתמית 'לנקות' אותם באמצעות החסרת מידע חופף בווליום שונה בין המיקרופונים, כולל רעשים או החזרים וכיוצ"ב.
אם כבר אנו עוסקים בניחושים, אל תהיה בטוח שלא מוסיפים ומחסירים הרמוניות מסדר גבוה יותר בצורה מלאכותית על הסיגנל הדיגיטלי. בשלב המיקס הדיגיטלי, השמים הם הגבול.
 

AK1

חבר משקיען
הודעות
11,926
מעורבות
2,941
נקודות
113
קומפרסור אנאלוגי 'תוחם' את טווח התדרים למנעד מסויים, ואף משווה את העוצמות בין התדרים השונים (מגביר את העוצמה הנמוכה, בד"כ הגבוהים ביותר, ומנמיך את הסופר חזקים) או במילים אחרות מאבד מידע.
הקלטה גולמית של האות ברזולוציה נמוכה מאבדת מידע אף היא.
האינטואיציה אומרת שאם ממקמים את המיקרופונים (ויכולים להיות עשרות ואף למעלה מזה) בצורה מספיק טובה עם מרחקים נכונים ע"פ סוג הכלי, הסקשן בתזמורת ויתכן שאפילו ע"פ אופי היצירה עצמה, אפשר להשיג את אותו אפקט מבלי לערוך מניפולציה בקונסולה לפני הדגימה.

אגב, אני לא מבין מדוע אתה "חושד" דווקא במניפולציה אנלוגית ברמת המקור. באותה מידה אפשר לשער שמאחר וכל הסיגנלים הם דיגיטלים במקור, ניתן אלגוריתמית 'לנקות' אותם באמצעות החסרת מידע חופף בווליום שונה בין המיקרופונים, כולל רעשים או החזרים וכיוצ"ב.
אם כבר אנו עוסקים בניחושים, אל תהיה בטוח שלא מוסיפים ומחסירים הרמוניות מסדר גבוה יותר בצורה מלאכותית על הסיגנל הדיגיטלי. בשלב המיקס הדיגיטלי, השמים הם הגבול.
נראה לי שלא קראת או לא הבנת את הפוסט.

אי אפשר למקם את המיקרופונים בצורה "חכמה" כך שתקטין טווח דינאמי של 130dB לטווח שניתן להקליט ב-16 ביט, לא ב-96dB התיאורטיים ובטח לא ב-60dB או כמה שזה בפועל עבור מוזיקה.

אז אני חושד שכדי שאפשר יהייה להקליט דיגיטאלית תזמורת סימפונית ב-16 ביט, בלי overflow, צריך לבצע dynamic range compression אנאלוגי לפני ה-ADC -- להחליש את הקטעים החזקים ולחזק את החלשים בצורה פרופורציונית. אין כאן עניין של תחימת תדרים. טריוויאלי שייש כאן סוג של איבוד מידע -- לפחות הטווח הדינאמי הולך לאיבוד.

כמובן שאי אפשר לעשות את זה דיגיטאלית לפני ה-ADC, וכמובן שלא אחרי ההקלטה אם היא נעשתה עם overflow/truncation.
 

נערך לאחרונה ב:

ליאור

חבר משקיען
הודעות
636
מעורבות
409
נקודות
63
חוששני שמי שלא הבין או התעמק במקרה לעיל זה דווקא אתה, עם זאת אני פורש ומשאיר לך לנהל את הדיון כלבבך.
 

AK1

חבר משקיען
הודעות
11,926
מעורבות
2,941
נקודות
113
הרגע נתקלתי במידע מוויקיפדיה שהייה חדש לי לגבי ההקלטות הדיגיטאליות המוקדמות של חברת Decca -- הן נעשו ב-18/48, לא ב-16/44 כמו רוב שאר החברות. זה עדיף אפילו על Soundstream שהייה ב-16/50. זה מסביר איך זה שההקלטות המוקדמות שלהם הצטיינו יחסית למתחרים.
 

ליאור

חבר משקיען
הודעות
636
מעורבות
409
נקודות
63
הלוואי עלי רמת אנרגיות כמו של חלק מהחבר'ה המשקיענים :)
 

לני

חבר משקיען
הודעות
695
מעורבות
275
נקודות
63
חוששני שמי שלא הבין או התעמק במקרה לעיל זה דווקא אתה, עם זאת אני פורש ומשאיר לך לנהל את הדיון כלבבך.


ליאור
לא משנה מה תכתוב לבחור הוא ימצא סיבה להתנגח בך.
 

omi

חבר משקיען
הודעות
885
מעורבות
424
נקודות
63
נראה לי שלא קראת או לא הבנת את הפוסט.

אי אפשר למקם את המיקרופונים בצורה "חכמה" כך שתקטין טווח דינאמי של 130dB לטווח שניתן להקליט ב-16 ביט, לא ב-96dB התיאורטיים ובטח לא ב-60dB או כמה שזה בפועל עבור מוזיקה.

אז אני חושד שכדי שאפשר יהייה להקליט דיגיטאלית תזמורת סימפונית ב-16 ביט, בלי overflow, צריך לבצע dynamic range compression אנאלוגי לפני ה-ADC -- להחליש את הקטעים החזקים ולחזק את החלשים בצורה פרופורציונית. אין כאן עניין של תחימת תדרים. טריוויאלי שייש כאן סוג של איבוד מידע -- לפחות הטווח הדינאמי הולך לאיבוד.

כמובן שאי אפשר לעשות את זה דיגיטאלית לפני ה-ADC, וכמובן שלא אחרי ההקלטה אם היא נעשתה עם overflow/truncation.

התעלמת כשהראיתי למה אין טווח דינאמי כה רחב. המספרים שהבאת במאמר ההוא נמדדו ממרחק של סנטימטרים בודדים מכלי הנגינה.בהתרחקות של 15 סמ (אוזן ימין אצל הקשתים) מדדו ירידה של 5-10db. הצבה של המיקרופונים במרחק 2 מטר תוריד עוד 10 db? הנה לך עוד שלושה ביטים.
 

AK1

חבר משקיען
הודעות
11,926
מעורבות
2,941
נקודות
113
התעלמת כשהראיתי למה אין טווח דינאמי כה רחב. המספרים שהבאת במאמר ההוא נמדדו ממרחק של סנטימטרים בודדים מכלי הנגינה.בהתרחקות של 15 סמ (אוזן ימין אצל הקשתים) מדדו ירידה של 5-10db. הצבה של המיקרופונים במרחק 2 מטר תוריד עוד 10 db? הנה לך עוד שלושה ביטים.
גם אם תוריד 10dB מ-130dB תישאר כל כך רחוק אפילו מה-96dB התיאורטיים וה-60dB המעשיים -- לפי בערך 6dB לביט מדובר על בין 6 ל-12 ביטים.
 


למעלה
תצוגת צבעים באתר (* פועל בדפדפנים מתקדמים מסוג Chrome ו- Firefox) תצוגה רגילה מותאם לעיוורי צבעים מותאם לכבדי ראייה
+ 100% -
סגור