ضغط البيانات

في معالجة الإشارات ، ضغط البيانات data compression، ترميز المصدر source coding, أوتخفيض معدل البتات bit-rate reduction هوعملية تشفير معلومات باستخدام عدد أقل من البتات من التمثيل الأصلي. أي ضغط معين هو فقد أو بدون فقد. يقلل الضغط بدون فقد البتات من خلال تحديد وإزالة التكرار الإحصائي. لا يتم فقدان أي معلومات في الضغط بدون فقد. يقلل الضغط المفقود من البتات عن طريق إزالة المعلومات غير الضرورية أوالأقل أهمية. عادةً ، ما يُشار إلى الجهاز الذي يقوم بضغط البيانات باسم المشفر ، والجهاز الذي يقوم بعكس العملية (فك الضغط) كمفكك الشفرة.

غالبًا ما يشار إلى عملية تقليل حجم ملف البيانات باسم ضغط البيانات. في سياق نقل البيانات ، يطلق عليه تشفير المصدر ؛ الترميز الذي يتم في مصدر البيانات قبل تخزينها أوإرسالها. لا ينبغي الخلط بين تشفير المصدر وتشفير القناة ، للكشف عن الأخطاء وتسليمها أوتشفير الخط ، وسائل ربط البيانات على إشارة.

يعد الضغط مفيدًا لأنه يقلل الموارد المطلوبة لتخزين البيانات ونقلها. يتم استهلاك الموارد الحاسوبية في عمليات الضغط وإلغاء الضغط. يخضع ضغط البيانات إلى مبادلة تعقيد الزمكان. على سبيل المثال ، مخطط ضغط للفيديوقد يحتاج أجهزة باهظة الثمن حتى يتم فك ضغط الصوت والصورة بسرعة كافية لعرضه أثناء فك ضغطه ، وخيار إلغاء ضغط الصوت والصورة بالكامل قبل مشاهدته قد يحدث غير مريح أويحتاج مساحة تخزين إضافية. يتضمن تصميم مخططات ضغط البيانات مقايضات بين عوامل مختلفة ، بما في ذلك درجة الضغط ، ومقدار التشويه الذي تم إدخاله (عند استخدام ضغط البيانات الضائع) ، والموارد الحسابية المطلوبة لضغط البيانات وفك ضغطها.

بدون فقد للبيانات

عادة ما يستخدم ضغط البيانات بدون فقد خوارزمية التكرار الإحصائي لتمثيل البيانات دون فقدان أي معلومات ، بحيث تكون العملية قابلة للعكس. الضغط بدون فقد ممكن لأن معظم البيانات الواقعية تظهر تكرارًا إحصائيًا. على سبيل المثال ، قد تحتوي الصورة على مساحات من الألوان لا تتغير عبر عدة وحدات بكسل ؛ بدلاً من ترميز "پكسل أحمر ، پكسل أحمر ، ..." قد يتم ترميز البيانات كـ "279 پكسل أحمر". هذا مثال أساسي على التشفير بطول التشغيل ؛ وهنالك الكثير من المخططات لتقليل حجم الملف من خلال التخلص من التكرار.

تعد طرق الضغط لمپل - زيڤ (LZ) من بين الخوارزميات الأكثر شيوعًا للتخزين بدون فقد.DEFLATE هواختلاف عن LZ وهومحسّن لسرعة الضغط ونسبة الضغط ، ولكن الضغط يمكن حتىقد يكون بطيئًا. في منتصف الثمانينيات ، وبعد العمل الذي قام به تيري ويلش ، أصبحت خوارزمية لمپل - زيڤ - ولش (LZW) بسرعة الطريقة المفضلة لمعظم أنظمة الضغط للأغراض العامة. يتم استخدام LZW في الصور GIF والبرامج مثل PKZIP والأجهزة مثل أجهزة المودم.تستخدم طرق LZ نموذج ضغط مستند إلى جدول حيث يتم استبدال إدخالات الجدول بسلاسل البيانات المتكررة. بالنسبة لمعظم طرق LZ ، يتم إنشاء هذا الجدول ديناميكيًا من البيانات السابقة في الإدخال. غالبًا ماقد يكون الجدول نفسه ترميز هفمان. الرموز المستندة إلى القواعد يمكن حتى يضغط مثل هذا الإدخال المتكرر للغاية بشكل فعال للغاية ، على سبيل المثال ، جمع البيانات البيولوجية من نفس النوع أوالأنواع ذات الصلة الوثيقة ، مجموعة كبيرة من المستندات ذات النسخ ، أرشفة الإنترنت ، إلخ. المهمة الأساسية للقواعد النحوية- تقوم الرموز المستندة إلى إنشاء قواعد خالية من السياق اشتقاق سلسلة واحدة. تتضمن خوارزميات ضغط القواعد العملية الأخرى خوارزمية سكوتشر وRe-Pair.

أقوى الضاغطات الحديثة التي لا بحاجة إلى فقد تستخدم نماذج احتمالية ، مثل التنبؤ بالمطابقة الجزئية. يمكن أيضًا النظر إلى تحويل بوروز- ويلر كشكل غير مباشر من النمذجة الإحصائية. في تحسين إضافي للاستخدام المباشر ل النموذج الاحتمالي ، يمكن ربط التقديرات الإحصائية بخوارزمية تسمى الترميز الحسابي. التشفير الحسابي هوأسلوب تشفير أكثر حداثة يستخدم الحسابات الرياضية لـ آلة الحالة المحدودة لإنتاج سلسلة من البتات المشفرة من سلسلة من رموز بيانات الإدخال. يمكن حتى يحقق ضغطًا فائقًا مقارنة بالتقنيات الأخرى مثل خوارزمية هفمان المعروفة. يستخدم حالة ذاكرة داخلية لتجنب الحاجة إلى إجراء تعيين واحد لواحد لرموز الإدخال الفردية لتمثيلات مميزة تستخدم عددًا سليمًا من البتات ، وتزيل الذاكرة الداخلية فقط بعد تشفير السلسلة الكاملة لرموز البيانات . ينطبق الترميز الحسابي بشكل جيد بشكل خاص على مهام ضغط البيانات التكيفية حيث تختلف الإحصاءات وتعتمد على السياق ، حيث يمكن حتى يقترن بسهولة بنموذج تكيف التوزيع الاحتمالي لبيانات الإدخال. كان أحد الأمثلة المبكرة على استخدام التشفير الحسابي هوميزة اختيارية (ولكن لم يتم استخدامها على نطاق واسع) لمعيار تشفير الصور JPEG. ومنذ ذلك الحين تم تطبيقه في تصميمات أخرى مختلفة بما في ذلك H.263 وH.264 / MPEG-4 AVC وHEVC لتشفير الصوت والصورة.

مع فقد للبيانات

في أواخر الثمانينيات ، أصبحت الصور الرقمية أكثر شيوعًا ، وظهرت معايير ضغط الصور بدون فقدان. في أوائل التسعينات ، بدأ استخدام طرق الضغط ذات فقد للبيانات على نطاق واسع. في هذه المخططات ، يتم قبول بعض من فقدان المعلومات لأن إسقاط التفاصيل غير الأساسية يمكن حتى يوفر مساحة التخزين. يوجد مبادلة لقاءة بين حفظ المعلومات وتقليل الحجم. تم تصميم مخططات ضغط البيانات المفقودة من خلال البحث حول كيفية إدراك الأشخاص للبيانات المعنية. على سبيل المثال ، تكون العين البشرية أكثر حساسية للتغيرات الدقيقة في النصوع من الاختلافات في اللون. يعمل JPEG ضغط الصور جزئيًا بتقريب أجزاء غير ضرورية من المعلومات. يستغل عدد من تنسيقات الضغط الشائعة هذه الاختلافات الإدراكية ، بما في ذلك الصوتيات للصوت ، والبصريات للصور والصوت والصورة.

تعتمد معظم أشكال الضغط مع فقد للبيانات على تحويل التشفير ، وخاصة تحويل جيب التمام المنفصل (DCT). تم اقتراحه لأول مرة عام 1972 بواسطة ناصر أحمد ، الذي طور بعد ذلك خوارزمية عاملة مع T. Natarajan وك. ر. راوعام 1973 ، قبل تقديمه في يناير 1974. DCT هي أكثر طرق الضغط مع الفقد استخدامًا ، وتستخدم في تنسيقات الوسائط المتعددة لـ الصور (مثل JPEG وHEIF), الصوت والصورة (مثل MPEG ، AVC وHEVC) والصوت (مثل MP3 ، AAC وVorbis).

يستخدم ضغط الصور الفقد في الكاميرا الرقمية ، لزيادة سعات التخزين. وبالمثل ، تستخدم DVD وBlu-ray ودفق الصوت والصورة تنسيق ترميز الصوت والصورة مع فقد للبيانات.

في الضغط الصوتي مع فقد ، تُستخدم طرق الصوتيات لإزالة المكونات غير المسموعة (أوالأقل سماعية) من الإشارة الصوتية. غالبًا ما يتم تطبيق ضغط الكلام البشري بتقنيات أكثر تخصصًا ؛ يتميز [[ترميز الكلام] بأنه نظام منفصل عن الضغط الصوتي للأغراض العامة. يتم استخدام ترميز الكلام في الاتصال عبر الإنترنت ، على سبيل المثال ، يتم استخدام ضغط الصوت لنسخ الأقراص المضغوطة ويتم فك تشفيرها بواسطة مشغلات الصوت.

نظرية

يتم توفير الأساس النظري للضغط بواسطة نظرية المعلومات ، وبشكل أكثر تحديدًا ، نظرية المعلومات الخوارزمية للضغط بدون خسارة ونظرية المعدل- التشويه للضغط الضائع. تم إنشاء هذه المجالات من الدراسة بشكل أساسي بواسطة كلود شانون ، الذي نشر أوراقًا أساسية حول هذا الموضوع في أواخر الأربعينيات وأوائل الخمسينيات. تضم المواضيع الأخرى المرتبطة بالضغط نظرية الترميز والاستدلال الإحصائي.

التفهم الآلي

هناك صلة وثيقة بين التفهم الآلي والضغط. يمكن استعمال نظام يتنبأ بـ الاحتمالات اللاحقة للتسلسل بالنظر إلى تاريخه بالكامل من أجل ضغط البيانات الأمثل (باستخدام الترميز الحسابي على توزيع المخرجات). يمكن استعمال الضاغط الأمثل للتنبؤ (من خلال إيجاد الرمز الذي يضغط بشكل أفضل ، بالنظر إلى التاريخ السابق). تم استخدام هذا المعادل كمبرر لاستخدام ضغط البيانات كمعيار لـ "الذكاء العام".

يمكن حتى تُظهر طريقة عرض بديلة خوارزميات الضغط تعيين السلاسل ضمنيًا في متجهات الفضاء المميز ضمنيًا ، وتحسب مقاييس التشابه القائمة على الضغط التشابه داخل مساحات المعالم هذه. لكل ضاغط C(.) نحدد فضاء المتجه المرتبط ، مثل C(.) يرسم سلسلة إدخال x ، يتوافق مع معيار المتجه ||~x||. يمنع الفضاء من الفحص الكامل للمساحات المميزة التي تقوم عليها جميع خوارزميات الضغط. بدلاً من ذلك ، تتخذ متجهات الميزات فحص ثلاث طرق ضغط تمثيلية بدون فقد ، LZW وLZ77 وPPM.

اختلاف البيانات

يمكن اعتبار ضغط البيانات كحالة خاصة لـ اختلاف البيانات. يتكون اختلاف البيانات من إنتاج "اختلاف" مع إعطاء "مصدر" و"هدف" ، مع تسليم إعادة إنتاج "الهدف" مع إعطاء "مصدر" و"اختلاف". نظرًا لعدم وجود مصدر أوهدف منفصل في ضغط البيانات ، يمكن للمرء حتى يعتبر ضغط البيانات اختلافًا عن البيانات مع بيانات المصدر الفارغة ، ويتوافق الملف المضغوط مع اختلاف عن لا شيء. هذا هونفس اعتبار المطلقة entropy وهومقياس لوگاريتمي لمعدل نقل المعلومات في رسالة أولغة معينة.(اللقاءة لضغط البيانات) كحالة خاصة لـ الإنتروپيا النسبية (اللقاءة لاختلاف البيانات) بدون بيانات أولية.

يستخدم مصطلح "الضغط التفاضلي" للتأكيد على اتصال اختلاف البيانات.

استخدامات

صورة

نشأ ترميز الانتروبيا في أربعينيات القرن العشرين بإدخال ترميز شانون- فانو, أساس ترميز هفمان الذي تم تطويره في عام 1950. يعود ترميز التحويل إلى أواخر الستينيات ، مع إدخال تحويل فورييه السريع (FFT) الترميز في عام 1968 وتحويل هادامارد في عام 1969.

إحدى تقنيات ضغط الصور المهمة هي تحويل جيب التمام المنفصل (DCT) ، وهي تقنية تم تطويرها في أوائل السبعينيات.DCT هي أساس JPEG ، تشكيل ضغط مع فقد تم تقديمه بواسطة مجموعة خبراء التصوير المشهجرة (JPEG) في عام 1992. يقلل JPEG بشكل كبير من كمية البيانات المطلوبة لتمثيل صورة على حساب انخفاض صغير نسبيًا في جودة الصورة وأصبح الأكثر استخدامًا تنسيق ملف صورة.كانت خوارزمية الضغط القائمة على DCT ذات الكفاءة العالية مسؤولة إلى حد كبير عن الانتشار الواسع لـ الرسم الرقمي والصورة الرقمية.

لمپل– زيڤ– ولش (LZW) تعبير عن خوارزمية للضغط بدون فقد تم تطويرها عام 1984. يتم استخدامها بتنسيق GIF ، الذي تم تقديمه في عام 1987.DEFLATE ، خوارزمية ضغط بدون فقد تم تحديدها في عام 1996 ، يتم استخدامها في تشكيل رسومات الشبكة المحمولة (PNG).

ضغط التموجات ، بدأ استخدام التموجات في ضغط الصور ، بعد تطوير تشفير DCT. تم تقديم معيار JPEG 2000 في عام 2000.على النقيض من خوارزمية DCT المستخدمة بواسطة تنسيق JPEG الأصلي ، يستخدم JPEG 2000 بدلاً من ذلك خوارزميات تحويل تموجات منفصلة (DWT). تم اختيار تقنية JPEG 2000 ، التي تتضمن امتداد Motion JPEG 2000 ، معيار ترميز الصوت والصورة لـ السينما الرقمية في عام 2004.

صوت

ضغط البيانات الصوتية ، يفضل عدم الخلط بينه وبين ضغط النطاق الديناميكي ، يمكن حتى يقلل من عرض النطاق الترددي للإرسال ومتطلبات تخزين البيانات الصوتية. يتم تطبيق خوارزميات ضغط الصوت في برنامج ترميز صوتي. توفر خوارزميات ضغط الصوت ذات الفقد ضغطًا أعلى بتكلفة الدقة وتستخدم في الكثير من التطبيقات الصوتية. تعتمد جميع هذه الخوارزميات تقريبًا على الصوتيات لإزالة دقة الأصوات الأقل سماعية أوتقليلها ، وبالتالي تقليل المساحة المطلوبة لتخزينها أونقلها.

في جميع من الضغط ذوفقد للبيانات وبدون فقد للبيانات، يتم تقليل تكرار المعلومات ، باستخدام طرق مثل التشفير والتعهد على الأنماط والتنبؤ الخطي إلى تقليل كمية المعلومات المستخدمة لتمثيل البيانات غير المضغوطة.

تعتمد المفاضلة المقبولة بين فقدان جودة الصوت وحجم الإرسال أوالتخزين على التطبيق. على سبيل المثال ، يحتوي قرص مضغوط (CD) ذوسعة 640 MB على ساعة واحدة تقريبًا من الموسيقى دقة عالية ، أوأقل من ساعتين من الموسيقى المضغوطة بدون فقد ، أوسبعة ساعات من الموسيقى المضغوطة في MP3 بتنسيق معدل البت المتوسط. يمكن حتى يقوم مسجل الصوت الرقمي عادةً بتخزين حوالي 200 ساعة من الكلام الواضح بوضوح في 640 640 MB.

ينتج عن الضغط الصوتي بدون فقد تمثيل للبيانات الرقمية التي يتم فك ضغطها إلى نسخة رقمية دقيقة من الدفق الصوتي الأصلي ، على عكس التشغيل من تقنيات الضغط ذات الفقد مثل Vorbis وMP3. نسب الضغط حوالي 50-60٪ من الحجم الأصلي ، وهومشابه لتلك الخاصة بضغط البيانات العامة دون فقد. لا يمكن للضغط بدون فقد الحصول على نسب ضغط عالية بسبب تعقيد التشكيلات الموجية والتغيرات السريعة في أشكال الصوت. تستخدم برامج الترميز مثل FLAC و Shorten و TTA التنبؤ الخطي لتقدير طيف الإشارة. تستخدم الكثير من هذه الخوارزميات الالتفاف مع المرشح [-1 1] إلى التبييض قليلاً أو تسطيح الطيف ، مما يسمح للضغط التقليدي بدون فقد للعمل بكفاءة أكبر. يتم عكس العملية عند فك الضغط.

عندما تتم معالجة الملفات الصوتية ، إما عن طريق مزيد من الضغط أومن أجل التحرير ، من المستحسن العمل من نسخة أصلية غير متغيرة (غير مضغوطة أومضغوطة بدون فقد). عادة ما ينتج عن معالجة ملف مضغوط بشكل خاطئ لسبب ما نتيجة نهائية أقل من إنشاء نفس الملف المضغوط من نسخة أصلية غير مضغوطة. بالإضافة إلى تحرير الصوت أومزجه ، غالبًا ما يستخدم ضغط الصوت بدون فقد للتخزين الأرشفي ، أوكنسخ رئيسية.

يوجد عدد من تشكيلات ضغط الصوت بدون فقد. Shorten كان تنسيقًا أولياً بدون فقد. تتضمن الإصدارات الأحدث برنامج ترميز الصوتيات ذات الفقد (FLAC) وآپل Apple Lossless (ALAC) وMPEG-4 ALS ومايكروسوفت Windows Media Audioتسعة بدون فقد (WMA بدون فقد) ، Monkey's Audio ، TTA ، وWavPack. راجع قائمة برامج الترميز بدون فقد للحصول على قائمة كاملة.

تتميز بعض تشكيلات الصوت بمزيج من التشكيل ذوفقد وتسليم بدون خسارة ؛ هذا يسمح بتجريد التسليم للحصول على ملف ذوفقد بسهولة. تتضمن هذه التشكيلات MPEG-4 SLS (قابلة للتحجيم إلى بدون فقد للبيانات) وWavPack وOptimFROG DualStream.

ترتبط التشكيلات الأخرى بنظام مميز ، مثل:

تحويل الدفق المستمر ، يتم استخدامه في قرص صوتي مضغوط من النوع الممتاز
Meridian Lossless Packing مستخدمة في DVD-Audio Dolby TrueHD Blu-ray وHD DVD

ضغط الصوت ذوفقد للبيانات

مقارنة بين طيفي من الصوت بتنسيق غير مضغوط والكثير من التنسيقات ذات فقد. تُظهر مخططات الأطياف ذات الفقد النطاق الترددي للترددات الأعلى ، وهي تقنية شائعة مرتبطة بضغط الصوت ذوالفقد.

يستخدم ضغط الصوت ذوالفقد في مجموعة واسعة من التطبيقات. بالإضافة إلى التطبيقات المباشرة (مشغلات MP3 أوأجهزة الكمبيوتر) ، يتم استخدام تدفقات الصوت المضغوطة رقميًا في معظم أقراص DVD للفيديو، والتلفزيون الرقمي ، ووسائط البث على الإنترنت ، والقمر الصناعي وراديوالكابل ، وبشكل متزايد في عمليات البث الإذاعي الأرضي. عادةً ما يحقق الضغط ذوالفقد ضغطًا أكبر بكثير من الضغط بدون فقد (5-20٪ من الحجم الأصلي ، بدلاً من 50-60٪) ، من خلال تجاهل البيانات الأقل أهمية.

كان ابتكار الضغط الصوتي ذوالفقد هواستخدام الصوتيات لإدراك أنه لا يمكن إدراك جميع البيانات في دفق صوتي بواسطة النظام السمعي البشري. تقلل معظم الضغوطات ذات الفقد التكرار الإدراكي من خلال التعهد أولاً على الأصوات غير الملائمة إدراكيًا ، أي الأصوات التي يصعب جدًا سماعها. تتضمن الأمثلة النموذجية الترددات العالية أوالأصوات التي تحدث في نفس الوقت مع الأصوات الأعلى. يتم ترميز هذه الأصوات بدقة منخفضة أولا يتم إطلاقها على الإطلاق.

نظرًا لطبيعة الخوارزميات ذات الفقد ، تعاني جودة الصوت عند فك ضغط الملف وإعادة ضغطه من (فقدان التوليد الرقمي). وهذا يجعل الضغط ذوالفقد غير مناسب لتخزين النتائج الوسيطة في تطبيقات هندسة الصوت الاحترافية ، مثل تحرير الصوت وتسجيل المسارات المتعددة. ومع ذلك ، فهي تحظى بشعبية كبيرة لدى المستخدمين النهائيين (خاصة MP3) حيث يمكن للميگابايت تخزين حوالي دقيقة من الموسيقى بجودة مناسبة.

طرق الترميز

لتحديد ما هي المعلومات في الإشارة الصوتية غير المرتبطة من الناحية الإدراكية ، تستخدم معظم خوارزميات الضغط ذات الفقد تحويلات مثل تحويل جيب التمام المنفصل المعدل (MDCT) لتحويل مجال الزمن أشكال الموجة المستندة إلى عينات إلى مجال تحويل. بمجرد تحويلها ، عادة إلى مجال التردد ، يمكن جعل البتات المخصصة للترددات المكونة بتات وفقًا لمدى سماعها. مسموعة المكونات الطيفية المحسوبة باستخدام عتبة السمع المطلق ومبادئ إخفاء متزامن - الظاهرة التي تحجب فيها إشارة بإشارة أخرى مفصولة بالتردد - وفي بعض الحالات ، التقنيع الزمني - حيث تحجب إشارة بإشارة أخرى مفصولة بالزمن. يمكن استعمال خطوط الصوت المتساوي أيضًا لتقدير الأهمية الإدراكية للمكونات. غالبًا ما تسمى نماذج هجريبة الأذن-الدماغ البشرية التي تتضمن هذه التأثيرات نموذج صوتي سمعي.

الأنواع الأخرى من الضاغطات ذات الفقد ، مثل التشفير التنبئي الخطي (LPC) المستخدم مع الكلام ، هي المبرمجات القائمة على المصدر. يستخدم هؤلاء المبرمجون نموذجًا لمولد الصوت (مثل الجهاز الصوتي البشري مع LPC) لتبييض الإشارة الصوتية (أي تسطيح طيفها) قبل التكمية. يمكن التفكير في LPC باعتباره تقنية أساسية للتشفير الإدراكي: إعادة تشكيل إشارة صوتية باستخدام تسقط خطي يشكل ضجيج تكويد المبرمج في طيف الإشارة المستهدفة ، ويخفيها جزئيًا.

غالبًا ما تستخدم التنسيقات ذات الفقد لتوزيع دفق الصوت أوالتطبيقات التفاعلية (مثل تشفير الكلام للإرسال الرقمي في شبكات الهاتف الخلوي). في مثل هذه التطبيقات ، يجب إلغاء ضغط البيانات أثناء تدفقها ، وليس بعد إرسال دفق البيانات بالكامل. لا يمكن استعمال جميع برامج الترميز الصوتية لتطبيقات التدفق ، وبالنسبة لهذه التطبيقات ، عادةً ما يتم اختيار برنامج ترميز مصمم لتدفق البيانات بشكل فعال.

ينتج زمن الانتنطق عن الأساليب المستخدمة لتشفير البيانات وفك تشفيرها. ستقوم بعض برامج الترميز بتحليل مبتر أطول من البيانات لتحسين الكفاءة ، ثم ترميزها بكيفية تتطلب شريحة أكبر من البيانات في وقت واحد لفك الشفرة. (غالبًا ما تنشئ برامج الترميز مقاطع تسمى "إطارًا" لإنشاء مقاطع بيانات منفصلة للتشفير وفك التشفير.) يمكن حتىقد يكون الكمون المتأصل في خوارزمية التشفير حرجاً ؛ على سبيل المثال ، عندماقد يكون هناك إرسال للبيانات في اتجاهين ، كما هوالحال مع محادثة هاتفية ، قد يؤدي التأخير الكبير إلى تدهور الجودة الإشارة بشكل حاد.

على عكس سرعة الضغط ، التي تتناسب مع عدد العمليات التي تتطلبها الخوارزمية ، يشير الكمون هنا إلى عدد العينات التي يجب تحليلها قبل معالجة كتلة الصوت. في الحالة الدنيا ،قد يكون الكمون تعبير عن عينات صفرية (على سبيل المثال ، إذا قلل المبرمج / مفكك التشفير ببساطة عدد البتات المستخدمة لقياس الإشارة). غالبًا ما تحتوي خوارزميات المجال الزمني مثل LPC أيضًا على زمن وصول منخفض ، وبالتالي فإن شعبيتها في تشفير الكلام للهاتف. في الخوارزميات مثل MP3 ، ومع ذلك ، يجب تحليل عدد كبير من العينات لتطبيق نموذج صوتي نفسي في مجال التردد ، ويكون زمن الانتنطق على أساس 23 مللي ثانية (46 مللي ثانية للاتصال ثنائي الاتجاه).

ترميز الكلام

ترميز الكلام فئة هامة من ضغط البيانات الصوتية. تختلف النماذج الإدراكية المستخدمة لتقدير ما يمكن للأذن البشرية سماعه بشكل عام إلى حد ما عن تلك المستخدمة للموسيقى. عادة ماقد يكون نطاق الترددات اللازمة لنقل أصوات الصوت البشري أضيق بكثير من ذلك المطلوب للموسيقى ، وعادة ماقد يكون الصوت أقل تعقيدًا. ونتيجة لذلك ، يمكن تشفير الكلام بجودة عالية باستخدام معدل بت منخفض نسبيًا.

إذا كانت البيانات المراد ضغطها تمثيلية (مثل الجهد الذي يختلف مع الزمن) ، يتم استخدام القياس الكمي لرقمنتها إلى أرقام (أعداد سليمة في العادة). ويشار إلى هذا بالتحويل التناظري إلى الرقمي (A / D). إذا كانت الأعداد السليمة المتولدة عن التكميةثمانية بتات لكل منها ، فإن النطاق الكامل للإشارة التناظرية ينقسم إلى 256 فاصلًا ويتم حساب جميع قيم الإشارة ضمن فاصل زمني بنفس الرقم. إذا تم إنشاء أعداد سليمة 16 بت ، فسيتم تقسيم نطاق الإشارة التناظرية إلى 65.536 فاصل زمني.

توضح هذه العلاقة الحل الوسط بين الدقة العالية (عدد كبير من الفواصل التناظرية) والضغط العالي (عدد سليم صغير تم إنشاؤه). يتم استخدام تطبيق القياس هذا من خلال الكثير من طرق ضغط الكلام. يتم تحقيق ذلك ، بشكل عام ، من خلال مزيج من نهجين:

فقط ترميز الأصوات التي يمكن حتى يصدرها صوت بشري واحد.
التخلص من المزيد من البيانات في الإشارة - الاحتفاظ بما يكفي لإعادة بناء صوت "واضح" بدلاً من نطاق التردد الكامل لسماع الإنسان.

ربما كانت أقدم الخوارزميات المستخدمة في تشفير الكلام (وضغط البيانات الصوتية بشكل عام) هي خوارزمية A-law وخوارزمية μ-law.

تاريخ

ملف:Placa-audioPC-925.jpg

Solidyne 922: أول ضغط بت صوتي تجاري في العالم بطاقة الصوت لكمبيوتر شخصي ، 1990

في عام 1950 ، قدمت مختبرات Bell براءة اختراع تعديل شفرة النبض التفاضلي (DPCM).تم تقديم DPCM ( تكيفي ADPCM) بواسطة پي. كمسكي و نيكيل س. جايانت وجيمس ل. فلانگان في مختبرات Bell في عام 1973.

تم استخدام الترميز الإدراكي لأول مرة لضغط تشفير الكلام ، مع التشفير التنبؤي الخطي (LPC). تعود المفاهيم الأولية لـ LPC إلى عمل فوميتادا إتاكورا (جامعة ناگويا) وشوزوسايتو(تلگراف وتلفون نپون) في عام 1966.خلال السبعينيات ، طور بشنوس. أتال ومانفراد ر. شرودر في مختبرات Bell شكلًا من LPC يُسمى الترميز التنبؤي التكيفي (APC) ، خوارزمية ترميز إدراكي حيث استغل خصائص إخفاء الأذن البشرية ، متبوعة في أوائل الثمانينيات باستخدام خوارزمية التنبؤ الخطي للرمز المثار (CELP) الذي حقق نسبة ضغط مهمة في ذلك الوقت. يستخدم الترميز الإدراكي من خلال تنسيقات ضغط الصوت الحديثة مثل MP3 and AAC.

تم تطوير تحويل جيب التمام المنفصل (DCT) ، بواسطة ناصر أحمد ، ت. ناتاراجان وك. ر. راوعام 1974, حيث قدم الأساس لـ تحويل جيب التمام المنفصل المعدل (MDCT) المستخدم بواسطة تشكيلات ضغط الصوت الحديثة مثل MP3 وAAC. تم اقتراح MDCT من قبل جي.پي. پرنسن وأ. و. جونسن وأ. ب. برادلي في عام 1987, بعد عمل سابق من قبل پرنسن وبرادلي في عام 1986. يتم استخدام MDCT من خلال تنسيقات ضغط الصوت الحديثة مثل Dolby Digital,MP3,والترميز الصوتي المتقدم (AAC).

تم تطوير أول نظام ضغط صوتي تجاري عالمي أتمتة البث من قبل أوسكار بونيلو، أستاذ الهندسة في جامعة بوينس آيرس. في عام 1983 ، باستخدام المبدأ الصوتي لإخفاء الحزم الحدية التي تم نشرها لأول مرة في عام 1967, بدأ في تطوير تطبيق عملي يعتمد على الكمبيوتر IBM PC الذي تم تطويره مؤخرًا ، وتم إطلاق نظام أتمتة البث في عام 1987 تحت اسم Audicom. بعد عشرين عامًا ، كانت جميع محطات الراديوتقريبًا في العالم تستخدم تقنية مماثلة تم تصنيعها بواسطة عدد من الشركات.

تم نشر خلاصة أدبية لمجموعة كبيرة ومتنوعة من أنظمة التشفير الصوتي في مجلة IEEE في "مجالات مختارة في الاتصالات" ("JSAC") في فبراير 1988. وبينما كانت هناك بعض الأوراق من قبل ذلك الوقت ، فإن هذه المجموعة موثقة وكاملة من المبرمجين الصوتيين العاملين النهائيين ، وجميعهم تقريبًا يستخدمون تقنيات الإدراك الحسي (أي الإخفاء) ونوعًا من تحليل التردد والترميز النهائي الخلفي الصامت. أشارت الكثير من هذه الأوراق إلى صعوبة الحصول على صوت رقمي جيد ونظيف لأغراض البحث. معظم ، إذا لم يكن جميع ، المؤلفين في إصدار "JSAC" كانوا نشطين أيضًا في لجنة الصوت MPEG-1 ، التي أنشأت تنسيق MP3.

ڤيديو

ضغط الصوت والصورة هوتطبيق عملي لتشفير المصدر في نظرية المعلومات. من الناحية العملية ، يتم استخدام معظم برامج ترميز الصوت والصورة جنبًا إلى جنب مع تقنيات ضغط الصوت لتخزين تدفقات البيانات المنفصلة ولكن كحزمة تكميلية واحدة مجمعة باستخدام ما يسمى تنسيق الصناديق".

يتطلب فيديوغير مضغوط ارتفاعًا كبيرًا من معدل البيانات. على الرغم من حتى ضغط الصوت والصورة بدون فقد حيث تعمل برامج الترميز بعامل ضغط منخمسة إلى 12 ، فإن H.264 فيديوضغط فائت لديه عامل ضغط بين 20 و200.

إن الطريقتين الرئيسيتين لضغط الصوت والصورة المستخدمة في معايير ترميز الصوت والصورة هي تحويل جيب التمام المنفصل (DCT) وتعويض الحركة (MC). تستخدم معظم معايير تشفير الصوت والصورة ، مثل تشكيلات H.26x وMPEG عادةً تشفير فيديوDCT المعوض عن الحركة (تعويض حركة الكتلة).

نظرية الترميز

يمكن تمثيل بيانات الصوت والصورة على أنها سلسلة من إطارات الصور الثابتة. عادة ما تحتوي هذه البيانات على كميات وفيرة من الزمانية والمكانية التكرار. تحاول خوارزميات ضغط الصوت والصورة تقليل التكرار وتخزين المعلومات بشكل أكثر إحكاما.

تستغل معظم تشكيلات ضغط الصوت والصورة و برامج الترميز التكرار المكاني والزمني (على سبيل المثال من خلال ترميز الاختلاف مع تعويض الحركة). يمكن تشفير التشابه عن طريق تخزين الاختلافات فقط على سبيل المثال الإطارات المجاورة مؤقتًا (التشفير بين الإطارات) أووحدات الپكسل المجاورة مكانيًا (التشفير داخل الإطار). يعد ضغط داخل الإطار (ترميز دلتا المؤقت) أحد أقوى تقنيات الضغط. تستخدم (إعادة) البيانات من إطار واحد أوأكثر في وقت سابق أولاحق في تسلسل لوصف الإطار الحالي. يستخدم الترميز داخل الإطار ، من ناحية أخرى ،البيانات من داخل الإطار الحالي فقط ،ضغط الصورة-لاتزال فعالة.

تستخدم فئة التنسيقات المتخصصة المستخدمة في كاميرات الصوت والصورة وتحرير الصوت والصورة أنظمة ضغط أقل تعقيدًا تقصر تقنيات التنبؤ الخاصة بها على التنبؤ داخل الإطار.

عادةً ما يستخدم ضغط الصوت والصورة أيضًا تقنيات الضغط مع فقد مثل التكمية التي تقلل من جوانب بيانات المصدر التي تكون (أكثر أوأقل) غير مرتبطة بالإدراك البصري البشري من خلال استغلال الميزات الإدراكية لرؤية الإنسان. على سبيل المثال ، يصعب إدراك الاختلافات الصغيرة في اللون من التغييرات في السطوع. يمكن لخوارزميات الضغط متوسط لون عبر هذه المناطق المتشابهة لتقليل المساحة ، بطريقة مماثلة لتلك المستخدمة في ضغط الصورة JPEG. كما هوالحال في جميع ضغط مع فقد ، هناك مبادلة بين جودة الصوت والصورة ومعدل البت ، وتكلفة معالجة الضغط وفك الضغط ، ومتطلبات النظام. قد يعرض الصوت والصورة عالي الضغط مرئيًا أومشتتًا بشكل صناعي.

بعض الطرق الأخرى غير تشكيلات التحويل القائمة على DCT ، مثل الضغط الكسري ، متابعة مطابقة واستخدام تحويل موجي منفصل (DWT) ، كانت موضوعًا لبعض الأبحاث ، ولكن لا يتم استخدامها عادةً في المنتجات العملية (باستثناء استخدام تشفير المويجات كمبرمج صورة ثابتة بدون تعويض الحركة). يظهر حتى الاهتمام بضغط الفركتال يتضاءل ، بسبب التحليل النظري الأخير الذي يظهر نقصًا نسبيًا في فعالية مثل هذه الأساليب.

التشفير بين الإطارات

يعمل التشفير بين الإطارات بمقارنة جميع إطار في الصوت والصورة مع الإطار السابق. تتم مقارنة الإطارات الفردية لتسلسل الصوت والصورة من إطار إلى الإطار التالي ، ويرسل ترميز ضغط الصوت والصورة الاختلافات فقط إلى الإطار المرجعي. إذا كان الإطار يحتوي على مناطق لم يتحرك فيها شيء ، فيمكن للنظام ببساطة إصدار أمر قصير ينسخ هذا الجزء من الإطار السابق إلى الإطار التالي. إذا تحركت أجزاء من الإطار بطريقة بسيطة ، يمكن حتى ينبعث الضاغط أمرًا (أطول قليلاً) يخبر برنامج إلغاء الضغط بنقل النسخة أوتدويرها أوتفتيحها أوتغميقها. لا يزال هذا الأمر الأطول أقصر بكثير من ضغط الإطار الداخلي. عادة ما يقوم المشفر أيضًا بإرسال إشارة متبقية تصف الاختلافات الأكثر دقة إلى الصور المرجعية. باستخدام تشفير الإنتروبيا ، تتمتع إشارات البقايا هذه بتمثيل مضغوط أكثر من الإشارة الكاملة. في مناطق الصوت والصورة ذات الحركة الأكبر ، يجب حتى يقوم الضغط بترميز المزيد من البيانات لمواكبة العدد الأكبر من وحدات البكسل التي تتغير. عادة أثناء التفجيرات ، اللهب ، أسراب الحيوانات ، وفي بعض طلقات التحريك ، تؤدي التفاصيل عالية التردد إلى انخفاض الجودة أوزيادة في معدل البت المتغير.

صيغ التحويل الهجينة القائمة على الكتل

مراحل معالجة برنامج تشفير الصوت والصورة النموذجي

واليوم ، تشهجر جميع طرق ضغط الصوت والصورة الشائعة الاستخدام تقريبًا (مثل تلك الموجودة في المعايير المعتمدة من قبل ITU-T أو ISO) في نفس البنية الأساسية التي يعود تاريخها إلى H. 261 الذي توحد في عام 1988 من قبل ITU-T. تعتمد في الغالب على DCT ، المطبقة على كتل مستطيلة من وحدات البكسل المجاورة ، والتنبؤ الزمني باستخدام متجهات الحركة ، وكذلك في الوقت الحاضر أيضًا خطوة تصفية داخل الحلقة.

في فترة التنبؤ ، يتم تطبيق تقنيات مختلفة إلغاء البيانات المكررة وتشفير الاختلافات التي تساعد على ربط البيانات ووصف البيانات الجديدة بناءً على البيانات المرسلة عملياً.

ثم يتم تحويل الكتل المستطيلة للبيانات (البقايا) پكسل إلى مجال التردد لتسهيل استهداف المعلومات غير المرتبطة في القياس الكمي ولخفض بعض التكرار المكاني. تم إدخال تحويل جيب التمام المنفصل (DCT) المستخدم على نطاق واسع في هذا الصدد بواسطة ن. أحمد ، ت. ناتاراجان وك. ر. راوعام 1974.

في فترة المعالجة ذات الفقد الرئيسية ، يتم قياس البيانات من أجل تقليل المعلومات غير المرتبطة بالإدراك البصري البشري.

في الفترة الأخيرة ، يتم التخلص من التكرار الإحصائي إلى حد كبير بواسطة المبرمج الأنتروپي والذي غالبًا ما يطبق شكلًا من أشكال الترميز الحسابي.

في فترة تصفية إضافية داخل الحلقة ، يمكن تطبيق مرشحات مختلفة على إشارة الصورة التي أعيد بناؤها. من خلال حساب هذه المرشحات أيضًا داخل حلقة التشفير ، يمكن حتى تساعد في الضغط لأنه يمكن تطبيقها على المواد المرجعية قبل استخدامها في عملية التنبؤ ويمكن توجيهها باستخدام الإشارة الأصلية. المثال الأكثر شيوعًا هومرشح إلغاء المنع الذي يطمس حجب التصنيعات من الانقطاعات الكمية في حدود كتلة التحويل.

تاريخ

في عام 1967 ، اقترح أ.ه. روبنسون وسي.شيري مخططًا لضغط النطاق الترددي [التشفير بطول التشغيل] لإرسال إشارات التلفزيون التناظرية.تحويل جيب التمام المنفصل (DCT) ، وهوأمر أساسي لضغط الصوت والصورة الحديث ، تم إدخاله بواسطة ناصر أحمد ، ت. ناتاراجان وك. ر. راوعام 1974.

H.261 ، الذي ظهر لأول مرة في عام 1988 ، قدم تجاريًا البنية الأساسية السائدة لتقنية ضغط الصوت والصورة. كان أول تشكيل ترميز الصوت والصورة يعتمد على ضغط DCT ، والذي سيصبح فيما بعد المعيار لجميع تنسيقات ترميز الصوت والصورة الرئيسية التي اتبعت. تم تطوير H.261 بواسطة عدد من الشركات ، بما في ذلك هيتاشي وPictureTel و NTT و BT وتوشيبا.

كانت أشهر معايير ترميز الصوت والصورة المستخدمة في برامج الترميز هي معايير MPEG. تم تطوير MPEG-1 بواسطة مجموعة خبراء الصور المتحركة (MPEG) في عام 1991 ، وتم تصميمه لضغط VHS - جودة الصوت والصورة. وقد نجحت في عام 1994 بواسطة MPEG-2 / H.262,التي طورها عدد من الشركات ، في المقام الأول سوني و تومسون وميتسوبيشي الكتريك.أصبح MPEG-2 تنسيق الصوت والصورة القياسي لـ DVD و SD التلفزيون الرقمي. في عام 1999 ، تبعتها MPEG-4 / H.263 ، التي كانت قفزة كبيرة إلى الأمام لتقنية ضغط الصوت والصورة. تم تطويره من قبل عدد من الشركات ، في المقام الأول ميتسوبيشي الكتريك ، هيتاشي وپاناسونيك.

إن تنسيق ترميز الصوت والصورة الأكثر استخدامًا هوH.264 / MPEG-4 AVC. تم تطويره في عام 2003 من قبل عدد من المنظمات ، في المقام الأول باناسونيك ، Godo Kaisha IP Bridge وLG الكترونكس.قدم AVC تجاريًا خوارزميات التشفير الحسابي الثنائي المتكيف مع السياق (CABAC) وخوارزميات التشفير المتغير الطول المتكيف مع السياق (CAVLC). AVC هوالمعيار الأساسي لترميز الصوت والصورة لـ Blu-ray Disc s ، ويستخدم على نطاق واسع من خلال بث خدمات الإنترنت مثل يوتيوب ونتفلكس وڤيميوومتجر iTunes ، وبرامج الويب مثل Adobe Flash Player وMicrosoft Silverlight ، والكثير من عمليات البث HDTV عبر التلفزيون الأرضي والفضائي.

الأصول

خوارزميات ضغط الأصول هي أحدث جيل من الخوارزميات الخالية من الفقد التي تضغط البيانات (عادة سلاسل من النيوكليوتيدات) باستخدام جميع من خوارزميات الضغط التقليدية والخوارزميات الجينية التي تتكيف مع نوع البيانات المحدد. في عام 2012 ، نشر فريق من الفهماء من جامعة جونز هوپكنز خوارزمية ضغط جيني لا تستخدم الجينوم المرجعي للضغط. تم تصميم HAPZIPPER خصيصًا لبيانات HapMap ويحقق ضغطًا يزيد عن 20 ضعفًا (تقليل حجم الملف بنسبة 95٪) ، مما يوفر ضغطًا أفضل من 2 إلى أربعة أضعاف وفي وقت أسرع بكثير من الأغراض العامة الرائدة مرافق ضغط. لهذا ، قدم جميع من شندا والحايك وبدر ترميزًا يستند إلى MAF (MAFE) ، مما يقلل من عدم تجانس مجموعة البيانات عن طريق فرز SNP حسب تردد الأليل الطفيف ، وبالتالي تجانس مجموعة البيانات. خوارزميات أخرى في عامي 2009 و2013 (DNAZip وGenomeZip) لها نسب ضغط تصل إلى 1200 ضعف ، مما يسمح بتخزينستة مليار جينوم بشري ثنائي الأساس في 2.5 ميگابايت (بالنسبة إلى الجينوم المرجعي أومتوسطها على الكثير من الجينومات).لمعيار في ضواغط بيانات فهم الوراثة / الجينوم ، انظر

التسقطات والإمكانات غير المستخدمة حالياً

تشير التقديرات إلى حتى إجمالي كمية البيانات المخزنة على أجهزة التخزين في العالم يمكن حتى يتم ضغطه بشكل أكبر باستخدام خوارزميات الضغط الحالية بمعامل متوسط متبقي يبلغ 4.5: 1. تشير التقديرات إلى حتى السعة التكنولوجية المجمعة للعالم لتخزين المعلومات توفر 1300 إكسابايت من أرقام الأجهزة في عام 2007 ، ولكن عندما يتم ضغط المحتوى المطابق بشكل مثالي ، فإن هذا يمثل فقط 295 إكسابايت من معلومات شانون.

انظر أيضاً

Auditory masking
HTTP compression
Kolmogorov complexity
Magic compression algorithm
Minimum description length
Modulo-N code
Motion coding
Perceptual audio coder
Range encoding
Sub-band coding
Universal code (data compression)
Vector quantization

مصادر

^ Wade, Graham (1994). (2 ed.). Cambridge University Press. p. 34. ISBN . Retrieved 2011-12-22. The broad objective of source coding is to exploit or remove 'inefficient' redundancy in the PCM source and thereby achieve a reduction in the overall source rate R.
^ Mahdi, O.A.; Mohammed, M.A.; Mohamed, A.J. (November 2012). "Implementing a Novel Approach an Convert Audio Compression to Text Coding via Hybrid Technique" (PDF). International Journal of Computer Science Issues. 9 (6, No. 3): 53–59. Retrieved 6 March 2013.
^ Pujar, J.H.; Kadlaskar, L.M. (May 2010). "A New Lossless Method of Image Compression and Decompression Using Huffman Coding Techniques" (PDF). Journal of Theoretical and Applied Information Technology. 15 (1): 18–23.
^ Salomon, David (2008). A Concise Introduction to Data Compression. Berlin: Springer. ISBN .
^ S. Mittal; J. Vetter (2015), "A Survey Of Architectural Approaches for Data Compression in Cache and Main Memory Systems", IEEE Transactions on Parallel and Distributed Systems (IEEE) 27 (5): 1524–1536, doi:10.1109/TPDS.2015.2435788
^ Tank, M.K. (2011). "Implementation of Lempel-ZIV algorithm for lossless compression using VHDL". Implementation of Limpel-Ziv algorithm for lossless compression using VHDL. Thinkquest 2010: Proceedings of the First International Conference on Contours of Computing Technology. Berlin: Springer. pp. 275–283. doi:10.1007/978-81-8489-989-4_51. ISBN .
^ Navqi, Saud; Naqvi, R.; Riaz, R.A.; Siddiqui, F. (April 2011). "Optimized RTL design and implementation of LZW algorithm for high bandwidth applications" (PDF). Electrical Review. 2011 (4): 279–285.
^ Wolfram, Stephen (2002). . Wolfram Media, Inc. p. 1069. ISBN .
^ Mahmud, Salauddin (March 2012). "An Improved Data Compression Method for General Data" (PDF). International Journal of Scientific & Engineering Research. 3 (3): 2. Retrieved 6 March 2013.
^ Lane, Tom. "JPEG Image Compression FAQ, Part 1". Internet FAQ Archives. Independent JPEG Group. Retrieved 6 March 2013.
^ G. J. Sullivan; J.-R. Ohm; W.-J. Han; T. Wiegand (December 2012). "Overview of the High Efficiency Video Coding (HEVC) Standard". IEEE Transactions on Circuits and Systems for Video Technology. IEEE. 22 (12): 1649–1668. doi:10.1109/TCSVT.2012.2221191.
^ Arcangel, Cory. "On Compression" (PDF). Retrieved 6 March 2013.
^ Ahmed, Nasir (January 1991). "How I Came Up With the Discrete Cosine Transform". Digital Signal Processing. 1 (1): 4–5. doi:10.1016/1051-2004(91)90086-Z.
^ Nasir Ahmed; T. Natarajan; Kamisetty Ramamohan Rao (January 1974). "Discrete Cosine Transform" (PDF). IEEE Transactions on Computers. C-23 (1): 90–93. doi:10.1109/T-C.1974.223784.
^ CCITT Study Group VIII und die Joint Photographic Experts Group (JPEG) von ISO/IEC Joint Technical Committee 1/Subcommittee 29/Working Groupعشرة (1993), "Annex D – Arithmetic coding", Recommendation T.81: Digital Compression and Coding of Continuous-tone Still images – Requirements and guidelines, pp. 54 ff, https://www.w3.org/Graphics/JPEG/itu-t81.pdf, retrieved on 2009-11-07
^ Marak, Laszlo. "On image compression" (PDF). University of Marne la Vallee. Archived from the original (PDF) on 28 May 2015. Retrieved 6 March 2013.
^ Mahoney, Matt. "Rationale for a Large Text Compression Benchmark". Florida Institute of Technology. Retrieved 5 March 2013.
^ Shmilovici A.; Kahiri Y.; Ben-Gal I.; Hauser S. (2009). "Measuring the Efficiency of the Intraday Forex Market with a Universal Data Compression Algorithm" (PDF). Computational Economics. 33 (2): 131–154. CiteSeerX 10.1.1.627.3751. doi:10.1007/s10614-008-9153-3.
^ I. Ben-Gal (2008). "On the Use of Data Compression Measures to Analyze Robust Designs" (PDF). IEEE Transactions on Reliability. 54 (3): 381–388. doi:10.1109/TR.2005.853280.
^ D. Scully; Carla E. Brodley (2006). "Compression and machine learning: A new perspective on feature space vectors" (PDF). Data Compression Conference, 2006.
^ Korn, D.; et al. "RFC 3284: The VCDIFF Generic Differencing and Compression Data Format". Internet Engineering Task Force. Retrieved 5 March 2013.
^ Korn, D.G.; Vo, K.P. (1995). B. Krishnamurthy (ed.). Vdelta: Differencing and Compression. Practical Reusable Unix Software. New York: John Wiley & Sons, Inc.
^ Claude Elwood Shannon (1948). Alcatel-Lucent (ed.). "A Mathematical Theory of Communication" (PDF). Bell System Technical Journal. 27 (3–4): 379–423, 623–656. Retrieved 2019-04-21.
^ David Albert Huffman (September 1952), "A method for the construction of minimum-redundancy codes", Proceedings of the IRE 40 (9): 1098–1101, doi:10.1109/JRPROC.1952.273898, http://compression.ru/download/articles/huff/huffman_1952_minimum-redundancy-codes.pdf
^ William K. Pratt, Julius Kane, Harry C. Andrews: "Hadamard transform image coding", in Proceedings of the IEEE 57.1 (1969): Seiten 58–68
^ "T.81 – DIGITAL COMPRESSION AND CODING OF CONTINUOUS-TONE STILL IMAGES – REQUIREMENTS AND GUIDELINES" (PDF). CCITT. September 1992. Retrieved 12 July 2019.
^ "The JPEG image format explained". BT.com. BT Group. 31 May 2018. Retrieved 5 August 2019.
^ Baraniuk, Chris (15 October 2015). "Copy protections could come to JPEGs". BBC News. BBC. Retrieved 13 September 2019.
^ "What Is a JPEG? The Invisible Object You See Every Day". The Atlantic. 24 September 2013. Retrieved 13 September 2019.
^ "The GIF Controversy: A Software Developer's Perspective". Retrieved 26 May 2015.
^ نطقب:Cite IETF
^ Hoffman, Roy (2012). . Springer Science & Business Media. p. 124. ISBN . Basically, wavelet coding is a variant on DCT-based transform coding that reduces or eliminates some of its limitations. (...) Another advantage is that rather than working withثمانية ×ثمانية blocks of pixels, as do JPEG and other block-based DCT techniques, wavelet coding can simultaneously compress the entire image.
^ Taubman, David; Marcellin, Michael (2012). . Springer Science & Business Media. ISBN .
^ Unser, M.; Blu, T. (2003). "Mathematical properties of the JPEG2000 wavelet filters" (PDF). IEEE Transactions on Image Processing. 12 (9): 1080–1090. Bibcode:2003ITIP...12.1080U. doi:10.1109/TIP.2003.812329. PMID 18237979.
^ Sullivan, Gary (8–12 December 2003). "General characteristics and design considerations for temporal subband video coding". ITU-T. Video Coding Experts Group. Retrieved 13 September 2019.CS1 maint: date format (link)
^ Bovik, Alan C. (2009). . Academic Press. p. 355. ISBN .
^ Swartz, Charles S. (2005). . Taylor & Francis. p. 147. ISBN .
^ The Olympus WS-120 digital speech recorder, according to its manual, can store about 178 hours of speech-quality audio in .WMA format in 500 MB of flash memory.
^ Coalson, Josh. "FLAC Comparison". Retrieved 6 March 2013.
^ Jaiswal, R.C. (2009). Audio-Video Engineering. Pune, Maharashtra: Nirali Prakashan. p. 3.41. ISBN .
^ Faxin Yu; Hao Luo; Zheming Lu (2010). Three-Dimensional Model Analysis and Processing. Berlin: Springer. p. 47. ISBN .
^ US2٬605٬361 (PDF version) ({{{y -{{{m -{{{d ) C. Chapin Cutler, Differential Quantization of Communication Signals.
^ P. Cummiskey, Nikil S. Jayant, and J. L. Flanagan, "Adaptive quantization in differential PCM coding of speech", Bell Syst. Tech. J., vol. 52, pp. 1105—1118, Sept. 1973
^ Cummiskey, P.; Jayant, Nikil S.; Flanagan, J. L. (1973). "Adaptive quantization in differential PCM coding of speech". The Bell System Technical Journal. 52 (7): 1105–1118. doi:10.1002/j.1538-7305.1973.tb02007.x. ISSN 0005-8580.
^ Schroeder, Manfred R. (2014). "Bell Laboratories". Acoustics, Information, and Communication: Memorial Volume in Honor of Manfred R. Schroeder. Springer. p. 388. ISBN .
^ Gray, Robert M. (2010). "A History of Realtime Digital Speech on Packet Networks: Part II of Linear Predictive Coding and the Internet Protocol" (PDF). Found. Trends Signal Process. 3 (4): 203–303. doi:10.1561/2000000036. ISSN 1932-8346.
^ Guckert, John (Spring 2012). "The Use of FFT and MDCT in MP3 Audio Compression" (PDF). University of Utah. Retrieved 14 July 2019.
^ J. P. Princen, A. W. Johnson und A. B. Bradley: Subband/transform coding using filter bank designs based on time domain aliasing cancellation, IEEE Proc. Intl. Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2161–2164, 1987.
^ John P. Princen, Alan B. Bradley: Analysis/synthesis filter bank design based on time domain aliasing cancellation, IEEE Trans. Acoust. Speech Signal Processing, ASSP-34 (5), 1153–1161, 1986.
^ Luo, Fa-Long (2008). . Springer Science & Business Media. p. 590. ISBN .
^ Britanak, V. (2011). "On Properties, Relations, and Simplified Implementation of Filter Banks in the Dolby Digital (Plus) AC-3 Audio Coding Standards". IEEE Transactions on Audio, Speech, and Language Processing. 19 (5): 1231–1241. doi:10.1109/TASL.2010.2087755.
^ Brandenburg, Karlheinz (1999). "MP3 and AAC Explained" (PDF). Archived (PDF) from the original on 2017-02-13.
^ "Summary of some of Solidyne's contributions to Broadcast Engineering". Brief History of Solidyne. Buenos Aires: Solidyne. Archived from the original onثمانية March 2013. Retrieved 6 March 2013.
^ Zwicker, Eberhard; et al. (1967). . Melville, NY: Acoustical Society of America. Archived from the original on 2000-09-14. Retrieved 2011-11-11.
^ "File Compression Possibilities". A Brief guide to compress a file in أربعة different ways.
^ "Video Coding". CSIP website. Center for Signal and Information Processing, Georgia Institute of Technology. Archived from the original on 23 May 2013. Retrieved 6 March 2013.
^ Dmitriy Vatolin (March 2007). . Moscow State University. Archived from the original. You must specify the date the archive was made using the |archivedate= parameter. http://compression.ru/video/codec_comparison/pdf/msu_lossless_codecs_comparison_2007_eng.pdf.
^ Chen, Jie; Koc, Ut-Va; Liu, KJ Ray (2001). . CRC Press. p. 71. ISBN .
^ Li, Jian Ping (2006). . World Scientific. p. 847. ISBN .
^ Robinson, A. H.; Cherry, C. (1967). "Results of a prototype television bandwidth compression scheme". Proceedings of the IEEE. IEEE. 55 (3): 356–364. doi:10.1109/PROC.1967.5493.
^ Ghanbari, Mohammed (2003). . Institution of Engineering and Technology. pp. 1–2. ISBN .
^ Reader, Cliff (2016-08-31). "Patent landscape for royalty-free video coding". 9971: 99711B, San Diego, California: Society of Photo-Optical Instrumentation Engineers. doi:10.1117/12.2239493. Lecture recording, from 3:05:10.
^ http://www.real.com/resources/digital-video-file-formats/
^ "Patent statement declaration registered as H261-07". ITU. Retrieved 11 July 2019.
^ "MPEG-2 Patent List" (PDF). MPEG LA. Retrieved 7 July 2019.
^ "MPEG-4 Visual - Patent List" (PDF). MPEG LA. Retrieved 6 July 2019.
^ "AVC/H.264 – Patent List" (PDF). MPEG LA. Retrieved 6 July 2019.
^ Chanda P, Bader JS, Elhaik E (27 Jul 2012). "HapZipper: sharing HapMap populations just got easier" (PDF). Nucleic Acids Research. 40 (20): e159. doi:10.1093/nar/gks709. PMC 3488212. PMID 22844100.
^ Christley S, Lu Y, Li C, Xie X (Jan 15, 2009). "Human genomes as email attachments". Bioinformatics. 25 (2): 274–5. doi:10.1093/bioinformatics/btn582. PMID 18996942.
^ Pavlichin DS, Weissman T, Yona G (September 2013). "The human genome contracts again". Bioinformatics. 29 (17): 2199–202. doi:10.1093/bioinformatics/btt362. PMID 23793748.
^ M. Hosseini, D. Pratas, and A. Pinho. 2016. A survey on data compression methods for biological sequences. Information 7(4):(2016): 56
^ "Data Compression via Logic Synthesis" (PDF).
^ Hilbert, Martin; López, Priscila (1 April 2011). "The World's Technological Capacity to Store, Communicate, and Compute Information". Science. 332 (6025): 60–65. Bibcode:2011Sci...332...60H. doi:10.1126/science.1200970. PMID 21310967.

وصلات خارجية

Data Compression Basics (Video)
Video compression 4:2:2 10-bit and its benefits
Why does 10-bit save bandwidth (even when content is 8-bit)?
Which compression technology should be used
Wiley – Introduction to Compression Theory
EBU subjective listening tests on low-bitrate audio codecs
Audio Archiving Guide: Music Formats (Guide for helping a user pick out the right codec)
MPEG 1&2 video compression intro (pdf format) at the Wayback Machine (archived September 28, 2007)
hydrogenaudio wiki comparison
Introduction to Data Compression by Guy E Blelloch from CMU
HD Greetings – 1080p Uncompressed source material for compression testing and research
Explanation of lossless signal compression method used by most codecs
Interactive blind listening tests of audio codecs over the internet
TestVid – 2,000+ HD and other uncompressed source video clips for compression testing
Videsignline – Intro to Video Compression
Data Footprint Reduction Technology
What is Run length Coding in video compression.

نطقب:Compression Methods

نطقب:Compression Software Implementations نطقب:Data

[Wade-1] Wade, Graham (1994). (2 ed.). Cambridge University Press. p. 34. ISBN . Retrieved 2011-12-22. The broad objective of source coding is to exploit or remove 'inefficient' redundancy in the PCM source and thereby achieve a reduction in the overall source rate R.

[mahdi53-2] Mahdi, O.A.; Mohammed, M.A.; Mohamed, A.J. (November 2012). "Implementing a Novel Approach an Convert Audio Compression to Text Coding via Hybrid Technique" (PDF). International Journal of Computer Science Issues. 9 (6, No. 3): 53–59. Retrieved 6 March 2013.

[PujarKadlaskar-3] Pujar, J.H.; Kadlaskar, L.M. (May 2010). "A New Lossless Method of Image Compression and Decompression Using Huffman Coding Techniques" (PDF). Journal of Theoretical and Applied Information Technology. 15 (1): 18–23.

[Salomon-4] Salomon, David (2008). A Concise Introduction to Data Compression. Berlin: Springer. ISBN .

[MittalVetter-5] S. Mittal; J. Vetter (2015), "A Survey Of Architectural Approaches for Data Compression in Cache and Main Memory Systems", IEEE Transactions on Parallel and Distributed Systems (IEEE) 27 (5): 1524–1536, doi:10.1109/TPDS.2015.2435788

[Tank-6] Tank, M.K. (2011). "Implementation of Lempel-ZIV algorithm for lossless compression using VHDL". Implementation of Limpel-Ziv algorithm for lossless compression using VHDL. Thinkquest 2010: Proceedings of the First International Conference on Contours of Computing Technology. Berlin: Springer. pp. 275–283. doi:10.1007/978-81-8489-989-4_51. ISBN .

[Optimized_LZW-7] Navqi, Saud; Naqvi, R.; Riaz, R.A.; Siddiqui, F. (April 2011). "Optimized RTL design and implementation of LZW algorithm for high bandwidth applications" (PDF). Electrical Review. 2011 (4): 279–285.

[Wolfram-8] Wolfram, Stephen (2002). . Wolfram Media, Inc. p. 1069. ISBN .

[mahmud2-9] Mahmud, Salauddin (March 2012). "An Improved Data Compression Method for General Data" (PDF). International Journal of Scientific & Engineering Research. 3 (3): 2. Retrieved 6 March 2013.

[TomLane-10] Lane, Tom. "JPEG Image Compression FAQ, Part 1". Internet FAQ Archives. Independent JPEG Group. Retrieved 6 March 2013.

[HEVC-11] G. J. Sullivan; J.-R. Ohm; W.-J. Han; T. Wiegand (December 2012). "Overview of the High Efficiency Video Coding (HEVC) Standard". IEEE Transactions on Circuits and Systems for Video Technology. IEEE. 22 (12): 1649–1668. doi:10.1109/TCSVT.2012.2221191.

[Arcangel-12] Arcangel, Cory. "On Compression" (PDF). Retrieved 6 March 2013.

[Ahmed-13] Ahmed, Nasir (January 1991). "How I Came Up With the Discrete Cosine Transform". Digital Signal Processing. 1 (1): 4–5. doi:10.1016/1051-2004(91)90086-Z.

[DCT-14] Nasir Ahmed; T. Natarajan; Kamisetty Ramamohan Rao (January 1974). "Discrete Cosine Transform" (PDF). IEEE Transactions on Computers. C-23 (1): 90–93. doi:10.1109/T-C.1974.223784.

[JPEG-15] CCITT Study Group VIII und die Joint Photographic Experts Group (JPEG) von ISO/IEC Joint Technical Committee 1/Subcommittee 29/Working Groupعشرة (1993), "Annex D – Arithmetic coding", Recommendation T.81: Digital Compression and Coding of Continuous-tone Still images – Requirements and guidelines, pp. 54 ff, https://www.w3.org/Graphics/JPEG/itu-t81.pdf, retrieved on 2009-11-07

[Marak-16] Marak, Laszlo. "On image compression" (PDF). University of Marne la Vallee. Archived from the original (PDF) on 28 May 2015. Retrieved 6 March 2013.

[Mahoney-17] Mahoney, Matt. "Rationale for a Large Text Compression Benchmark". Florida Institute of Technology. Retrieved 5 March 2013.

[Market_Efficiency-18] Shmilovici A.; Kahiri Y.; Ben-Gal I.; Hauser S. (2009). "Measuring the Efficiency of the Intraday Forex Market with a Universal Data Compression Algorithm" (PDF). Computational Economics. 33 (2): 131–154. CiteSeerX 10.1.1.627.3751. doi:10.1007/s10614-008-9153-3.

[Ben-Gal-19] I. Ben-Gal (2008). "On the Use of Data Compression Measures to Analyze Robust Designs" (PDF). IEEE Transactions on Reliability. 54 (3): 381–388. doi:10.1109/TR.2005.853280.

[ScullyBrodley-20] D. Scully; Carla E. Brodley (2006). "Compression and machine learning: A new perspective on feature space vectors" (PDF). Data Compression Conference, 2006.

[RFC_3284-21] Korn, D.; et al. "RFC 3284: The VCDIFF Generic Differencing and Compression Data Format". Internet Engineering Task Force. Retrieved 5 March 2013.

[Vdelta-22] Korn, D.G.; Vo, K.P. (1995). B. Krishnamurthy (ed.). Vdelta: Differencing and Compression. Practical Reusable Unix Software. New York: John Wiley & Sons, Inc.

[Shannon-23] Claude Elwood Shannon (1948). Alcatel-Lucent (ed.). "A Mathematical Theory of Communication" (PDF). Bell System Technical Journal. 27 (3–4): 379–423, 623–656. Retrieved 2019-04-21.

[Huffman-24] David Albert Huffman (September 1952), "A method for the construction of minimum-redundancy codes", Proceedings of the IRE 40 (9): 1098–1101, doi:10.1109/JRPROC.1952.273898, http://compression.ru/download/articles/huff/huffman_1952_minimum-redundancy-codes.pdf

[Hadamard-25] William K. Pratt, Julius Kane, Harry C. Andrews: "Hadamard transform image coding", in Proceedings of the IEEE 57.1 (1969): Seiten 58–68

[t81-26] "T.81 – DIGITAL COMPRESSION AND CODING OF CONTINUOUS-TONE STILL IMAGES – REQUIREMENTS AND GUIDELINES" (PDF). CCITT. September 1992. Retrieved 12 July 2019.

[27] "The JPEG image format explained". BT.com. BT Group. 31 May 2018. Retrieved 5 August 2019.

[28] Baraniuk, Chris (15 October 2015). "Copy protections could come to JPEGs". BBC News. BBC. Retrieved 13 September 2019.

[Atlantic-29] "What Is a JPEG? The Invisible Object You See Every Day". The Atlantic. 24 September 2013. Retrieved 13 September 2019.

[cloanto-30] "The GIF Controversy: A Software Developer's Perspective". Retrieved 26 May 2015.

[IETF-31] نطقب:Cite IETF

[Hoffman-32] Hoffman, Roy (2012). . Springer Science & Business Media. p. 124. ISBN . Basically, wavelet coding is a variant on DCT-based transform coding that reduces or eliminates some of its limitations. (...) Another advantage is that rather than working withثمانية ×ثمانية blocks of pixels, as do JPEG and other block-based DCT techniques, wavelet coding can simultaneously compress the entire image.

[33] Taubman, David; Marcellin, Michael (2012). . Springer Science & Business Media. ISBN .

[Unser-34] Unser, M.; Blu, T. (2003). "Mathematical properties of the JPEG2000 wavelet filters" (PDF). IEEE Transactions on Image Processing. 12 (9): 1080–1090. Bibcode:2003ITIP...12.1080U. doi:10.1109/TIP.2003.812329. PMID 18237979.

[35] Sullivan, Gary (8–12 December 2003). "General characteristics and design considerations for temporal subband video coding". ITU-T. Video Coding Experts Group. Retrieved 13 September 2019.CS1 maint: date format (link)

[36] Bovik, Alan C. (2009). . Academic Press. p. 355. ISBN .

[37] Swartz, Charles S. (2005). . Taylor & Francis. p. 147. ISBN .

[Olympus_WS-120-38] The Olympus WS-120 digital speech recorder, according to its manual, can store about 178 hours of speech-quality audio in .WMA format in 500 MB of flash memory.

[FLAC-39] Coalson, Josh. "FLAC Comparison". Retrieved 6 March 2013.

[Jaiswal-40] Jaiswal, R.C. (2009). Audio-Video Engineering. Pune, Maharashtra: Nirali Prakashan. p. 3.41. ISBN .

[faxin47-41] Faxin Yu; Hao Luo; Zheming Lu (2010). Three-Dimensional Model Analysis and Processing. Berlin: Springer. p. 47. ISBN .

[DPCM-42] US2٬605٬361 (PDF version) ({{{y -{{{m -{{{d ) C. Chapin Cutler, Differential Quantization of Communication Signals.

[43] P. Cummiskey, Nikil S. Jayant, and J. L. Flanagan, "Adaptive quantization in differential PCM coding of speech", Bell Syst. Tech. J., vol. 52, pp. 1105—1118, Sept. 1973

[44] Cummiskey, P.; Jayant, Nikil S.; Flanagan, J. L. (1973). "Adaptive quantization in differential PCM coding of speech". The Bell System Technical Journal. 52 (7): 1105–1118. doi:10.1002/j.1538-7305.1973.tb02007.x. ISSN 0005-8580.

[Schroeder2014-45] Schroeder, Manfred R. (2014). "Bell Laboratories". Acoustics, Information, and Communication: Memorial Volume in Honor of Manfred R. Schroeder. Springer. p. 388. ISBN .

[46] Gray, Robert M. (2010). "A History of Realtime Digital Speech on Packet Networks: Part II of Linear Predictive Coding and the Internet Protocol" (PDF). Found. Trends Signal Process. 3 (4): 203–303. doi:10.1561/2000000036. ISSN 1932-8346.

[Guckert-47] Guckert, John (Spring 2012). "The Use of FFT and MDCT in MP3 Audio Compression" (PDF). University of Utah. Retrieved 14 July 2019.

[48] J. P. Princen, A. W. Johnson und A. B. Bradley: Subband/transform coding using filter bank designs based on time domain aliasing cancellation, IEEE Proc. Intl. Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2161–2164, 1987.

[49] John P. Princen, Alan B. Bradley: Analysis/synthesis filter bank design based on time domain aliasing cancellation, IEEE Trans. Acoust. Speech Signal Processing, ASSP-34 (5), 1153–1161, 1986.

[Luo-50] Luo, Fa-Long (2008). . Springer Science & Business Media. p. 590. ISBN .

[51] Britanak, V. (2011). "On Properties, Relations, and Simplified Implementation of Filter Banks in the Dolby Digital (Plus) AC-3 Audio Coding Standards". IEEE Transactions on Audio, Speech, and Language Processing. 19 (5): 1231–1241. doi:10.1109/TASL.2010.2087755.

[brandenburg-52] Brandenburg, Karlheinz (1999). "MP3 and AAC Explained" (PDF). Archived (PDF) from the original on 2017-02-13.

[Solidyne-53] "Summary of some of Solidyne's contributions to Broadcast Engineering". Brief History of Solidyne. Buenos Aires: Solidyne. Archived from the original onثمانية March 2013. Retrieved 6 March 2013.

[Zwicker-54] Zwicker, Eberhard; et al. (1967). . Melville, NY: Acoustical Society of America. Archived from the original on 2000-09-14. Retrieved 2011-11-11.

[Possibilities-55] "File Compression Possibilities". A Brief guide to compress a file in أربعة different ways.

[CSIP-56] "Video Coding". CSIP website. Center for Signal and Information Processing, Georgia Institute of Technology. Archived from the original on 23 May 2013. Retrieved 6 March 2013.

[MSU2007-57] Dmitriy Vatolin (March 2007). . Moscow State University. Archived from the original. You must specify the date the archive was made using the |archivedate= parameter. http://compression.ru/video/codec_comparison/pdf/msu_lossless_codecs_comparison_2007_eng.pdf.

[58] Chen, Jie; Koc, Ut-Va; Liu, KJ Ray (2001). . CRC Press. p. 71. ISBN .

[Li-59] Li, Jian Ping (2006). . World Scientific. p. 847. ISBN .

[robinson-60] Robinson, A. H.; Cherry, C. (1967). "Results of a prototype television bandwidth compression scheme". Proceedings of the IEEE. IEEE. 55 (3): 356–364. doi:10.1109/PROC.1967.5493.

[Ghanbari-61] Ghanbari, Mohammed (2003). . Institution of Engineering and Technology. pp. 1–2. ISBN .

[patents-62] Reader, Cliff (2016-08-31). "Patent landscape for royalty-free video coding". 9971: 99711B, San Diego, California: Society of Photo-Optical Instrumentation Engineers. doi:10.1117/12.2239493. Lecture recording, from 3:05:10.

[history-63] ttp://www.real.com/resources/digital-video-file-formats/

[64] "Patent statement declaration registered as H261-07". ITU. Retrieved 11 July 2019.

[mp2-patents-65] "MPEG-2 Patent List" (PDF). MPEG LA. Retrieved 7 July 2019.

[mp4-patents-66] "MPEG-4 Visual - Patent List" (PDF). MPEG LA. Retrieved 6 July 2019.

[avc-patents-67] "AVC/H.264 – Patent List" (PDF). MPEG LA. Retrieved 6 July 2019.

[HapZipper-68] Chanda P, Bader JS, Elhaik E (27 Jul 2012). "HapZipper: sharing HapMap populations just got easier" (PDF). Nucleic Acids Research. 40 (20): e159. doi:10.1093/nar/gks709. PMC 3488212. PMID 22844100.

[genome_email-69] Christley S, Lu Y, Li C, Xie X (Jan 15, 2009). "Human genomes as email attachments". Bioinformatics. 25 (2): 274–5. doi:10.1093/bioinformatics/btn582. PMID 18996942.

[genome_contracts-70] Pavlichin DS, Weissman T, Yona G (September 2013). "The human genome contracts again". Bioinformatics. 29 (17): 2199–202. doi:10.1093/bioinformatics/btt362. PMID 23793748.

[Morteza-71] M. Hosseini, D. Pratas, and A. Pinho. 2016. A survey on data compression methods for biological sequences. Information 7(4):(2016): 56

[72] "Data Compression via Logic Synthesis" (PDF).

[World_Capacity-73] Hilbert, Martin; López, Priscila (1 April 2011). "The World's Technological Capacity to Store, Communicate, and Compute Information". Science. 332 (6025): 60–65. Bibcode:2011Sci...332...60H. doi:10.1126/science.1200970. PMID 21310967.