الارتباط والسببية ومعايير "برادفورد هيل" لتحديد السببية
كُتبت في: 20/09/2021
كثيرًا ما نرى الخلط بين مصطلحي الارتباط/العلاقة Correlation/Association ومصطلح السببية Causation وما ينجم عن هذا الخلط من مغالطات علمية ومنطقية أهمها مغالطة "الارتباط لا يعني السببية Correlation does not imply causation" أو كما تسمى باللاتيني "cum hoc ergo propter hoc" بمعنى "مع هذا، وبالتالي بسبب هذا" أي أن حدوث شيء مع شيء يعني أن أحدهما سبب للآخر.. تستخدم هذه المغالطة كثيرًا لتفسير سبب حدوث أمر ما بأمر آخر ظهر أو حدث معه، أو لنسب الفضل في شيء ما لشيء آخر حدث معه..
أمثلة على هذه المغالطة:
- طائر البوم يظهر في الليل، والقمر يظهر في الليل، إذًا البوم يظهر بسبب ظهور القمر.
- يزداد أكل الآيس كريم في الصيف، وتزداد حالات حروق الشمس في الصيف، إذًا أكل الآيس كريم هو السبب في حروق الشمس.
- بلد ما متقدم معماريًا، أغلب أهل هذا البلد يعتنقون إيديولوجية ما، فهذا يعني أن لابد أن سبب هذا التقدم هو هذه الإيديولوجية.
قد يكون هذا سهل كما في المثال الأول والثاني ولكنه صعب في المثال الثالث"
في البداية دعونا نحرر المصطلحات:
السببية Causation بين عاملين أو شيئين يعني أن بينهما علاقة سبب وتأثير Cause-and-Effect Relationship بحيث أن أحدهما سبب للآخر، بينما الارتباط لا يعني بالضرورة أن يكون أحدهما سببًا للآخر بل يكفي وجود ارتباط حدوث بينهما..
وحسب Nature Journal في مقالها Association, correlation and causation، فإنه لا ينبغي الخلط بين الارتباط والسببية؛ فوجود سببية Causation بين عاملين كأن نقول أن X تسبب في Y يعني أن بينهم ارتباط Association، والاثنين مرتبطان Associated (تابعان Dependent). ومع ذلك العكس ليس صحيح، فمن الممكن أن تنشأ الارتباطات Associations بين المتغيرات في وجود السببية (X تسبب Y) أو غياب السببية (أي أن لديهم سببًا مشتركًا دون أن يكون أحدهما سببًا للآخر).
على سبيل المثال، في إحدى المقالات عن Bayesian networks لوحظ أن الأشخاص الذين يشربون يوميًا أكثر من 4 أكواب من القهوة لديهم فرصة أقل للإصابة بسرطان الجلد. هذا لا يعني بالضرورة أن القهوة تقاوم السرطان، فقد يكون أحد التفسيرات هو أن الأشخاص يشربون الكثير من القهوة لأنهم يعملون في الداخل لساعات طويلة وبالتالي يتعرضون للشمس بشكل أقل، والتعرض للشمس هو أحد مسببات سرطان الجلد. فإذا كانت هذه هي الحالة، فإن عدد الساعات التي تم قضاؤها في الهواء الطلق هو متغير مربك Confounding Variable وهو سبب مشترك لكلا الملاحظتين. في مثل هذه الحالة، لا يمكن استنتاج علاقة سببية مباشرة؛ وعندها يقترح الارتباط كمجرد فرضية، مثل سبب مشترك، لكنه لا يستخدم كدليل. لذا عند دراسة العديد من المتغيرات في الأنظمة المعقدة، يمكن أن تنشأ ارتباطات زائفة، وبالتالي، فإن الارتباط لا يعني السببية.
في اللغة اليومية وفي كثير من الثقافات، يتم استخدام التبعية/الاعتماد Dependence والارتباط Association والارتباط بالتبادل (العلاقة) Correlation ككلمات بمعنى تبادلي Interchangeable أي تستخدم بالمعنى نفسه. لكن من الناحية الفنية، فإن الارتباط Association مرادف للتبعية/الاعتماد Dependence ويختلف عن العلاقة Correlation.
فالارتباط Association هو علاقة عامة جدًا: حيث يوفر أحد المتغيرات معلومات عن الآخر. أما العلاقة أو الارتباط التبادلي Correlation هو أكثر تحديدًا: ففيها المتغيرين يعتبران متعلقين ببعضهما Correlated عندما تشكل العلاقة بينهما اتجاهًا متزايدًا أو متناقصًا، أي بازدياد أحدهما يزدا الآخر فتكون العلاقة إيجابية Positive Correlation أو بازدياد أحدهما يقل الآخر فتكون العلاقة سلبية Negative Correlation.
البعض يعتبر العلاقة Correlation هي تحديد لقوة الارتباط Association عبر ما يسمى معامل الارتباط/العلاقة Correlation Coefficient والذي يأخذ قيمة بين +1 (Positive Correlation) و-1 (Negative Correlation).
فظهور البوم والقمر مثلًا بينهما ارتباط Association ولكن ليس بينهما علاقة Correlation فازدياد ظهور أحدهما لا يرتبط بازدياد أو نقصان ظهور الآخر..
وهنا نعود إلى السببية، فالسببية Causation هي نوع من الارتباط Association ولكن ليس كل ارتباط يعني وجود علاقة Correlation أو سببية Causation.. فقد وجدت علاقة سلبية Negative Correlation بين معدلات الطلاق في البحرية ومعدل استهلاك السمنة، فهل السمنة هي السبب؟
وعلاقة إيجابية Positive Correlation بين شهادات الدكتوراه في الهندسة المدنية ومعدل استهلاك جبنة الموتساريلا، فهل جبنة الموتساريلا هي السبب؟
ولمزيد من العلاقات اللطيفة ادخلوا الرابط الآتي: العلاقات الزائفة Spurious Correlations..
إذًا ما هي المعايير التي عبرها نقول أن علاقة بين عاملين هي علاقة سببية؟
عام 1965، نشر السير أوستن برادفورد هيل Sir Austin Bradford Hill تسع "وجهات نظر" للمساعدة في تحديد ما إذا كانت الارتباطات الوبائية الملحوظة سببية. ومنذ ذلك الحين، أصبحت "معايير برادفورد هيل Bradford Hill Criteria" الإطار الأكثر تكرارًا للاستدلال السببي Causal Inference في الدراسات الوبائية (رابط المنشور: The Environment and Disease: Association or Causation? 1965).
أدت التطورات في علم الوراثة، والبيولوجيا الجزيئية، وعلم السموم، وعلم التعرض، والإحصاء إلى زيادة قدراتنا التحليلية لاستكشاف العلاقات المحتملة بين السبب والنتيجة Cause-and-Effect Relationships، وتمت إعادة تقييم لكيفية تفسير كل معيار من معايير "برادفورد هيل" عند النظر في مجموعة متنوعة من أنواع البيانات التي تتجاوز دراسات علم الأوبئة الكلاسيكية كما في عدة دراسات منها الصحية كما في هذا البحث حول التطبيق على الأوبئة Applying the Bradford Hill criteria in the 21st century، وهذا البحث حول التطبيق في الطب النفسي العصبي Applying Bradford Hill's Criteria for Causation to Neuropsychiatry.
إذًا ما هي هذه المعايير؟
ذكر "برادفورد هيل" تسع معايير وأحيانًا يضاف إليها معيار عاشر، وهي:
- القوة Strength (حجم التأثير Effect Size): كلما كان الارتباط أكبر، كلما زاد احتمال كونه سببيًا.. ولكن الارتباط الصغير لا يعني أنه لا يوجد تأثير سببي.
- الاتساق Consistency (إمكانية إعادة الإنتاج Reproducibility): النتائج المتسقة التي لاحظها أشخاص مختلفون في أماكن مختلفة مع عينات مختلفة بين العاملين تقوي احتمال حدوث تأثير، وكذلك إمكانية إعادة إنتاج العوامل نتيجة لبعضها البعض في أماكن أخرى وتجارب أخرى يزيد احتمال كون الارتباط سببي.
- الخصوصية Specificity: يزداد الاحتمال في كون العلاقة سببية كلما كانت المجموعة محددة أكثر ومضبوطة أكثر ومخصصة أكثر وليست مفتوحة للعديد من المؤثرات الأخرى التي قد تكون السبب.
- الوقتية Temporality: يجب أن يحدث التأثير بعد السبب وإذا كان هناك تأخير متوقع بين السبب والنتيجة المتوقعة، فيجب أن يحدث التأثير بعد هذا التأخير، لذا موضوع التراتبية والتزامنية أمر مهم لتحديد نوع العلاقة.
- التدرج البيولوجي Biological gradient (العلاقة بين الجرعة والاستجابة dose-response relationship): يجب أن يؤدي التعرض الأكبر بشكل عام إلى حدوث تأثير أكبر إما سلبًا أو إيجابًا، أي إذا كان أحد العوال سببًا للآخر فازدياد العامل سيزيد التأثير سواءً كان التأثير سلبي أو إيجابي.
- المعقولية Plausibility: الآلية المعقولة بين السبب والنتيجة مهمة وطبعًا هي متعلقة بالمعرفة الحالية، ولكن لا يمكنك فرض آلية غير منطقية أو التحجج بأنه يوجد آلية لكن لا نعرفها.
- التماسك Coherence: يزيد التماسك بين النتائج على الأرض ونتائج التجارب من تأكيد أو نفي نوعية التأثير وهل هو سببي أو لا.
- التجربة Experiment: من المفيد اللجوء إلى الأدلة التجريبية.
- القياس والتشبيه Analogy: يمكن استخدام أوجه التشابه أو التشابهات بين الارتباط المرصود المراد معرفة نوعه وأي ارتباطات أخرى معروفة النوع.
- المعكوسية Reversibility: وهو المعيار العاشر الذي يضيفه بعض المؤلفين ويقصد بالمعكوسية أو إمكانية الانعكاس أنه إذا تم حذف السبب من العلاقة السببية، فيجب أن يختفي التأثير أيضًا.
ومن هنا نرى أن ظهور شيئين مع بعضهما البعض لا يعني بالضرورة أن العلاقة بينهما هي علاقة سببية وأن أحدهما ينتج عن الآخر فالارتباط لا يعني السببية دومًا Correlation does not imply causation.
............
المصادر:
- Altman, N., Krzywinski, M. Association, correlation and causation. Nat Methods 12, 899–900 (2015). https://doi.org/10.1038/nmeth.3587
- Puga, J., Krzywinski, M. & Altman, N. Bayesian networks. Nat Methods 12, 799–800 (2015). https://doi.org/10.1038/nmeth.3550
- Spurious Correlations http://www.tylervigen.com/spurious-correlations
- Hill AB. The Environment and Disease: Association or Causation? Proceedings of the Royal Society of Medicine. 1965;58(5):295-300. doi:10.1177/003591576505800503 https://journals.sagepub.com/doi/10.1177/003591576505800503
- Fedak KM, Bernal A, Capshaw ZA, Gross S. Applying the Bradford Hill criteria in the 21st century: how data integration has changed causal inference in molecular epidemiology. Emerg Themes Epidemiol. 2015;12:14. Published 2015 Sep 30. doi:10.1186/s12982-015-0037-4 https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4589117/
- Robert van Reekum, David L. Streiner, and David K. Conn, Applying Bradford Hill's Criteria for Causation to Neuropsychiatry, The Journal of Neuropsychiatry and Clinical Neurosciences 2001 13:3, 318-325 https://neuro.psychiatryonline.org/doi/10.1176/jnp.13.3.318
Comments
Post a Comment