VPN Routing Chaos — لما الترافيك يضيع في النص!
🌐 فوضى في توجيه الـVPN — لما الترافيك يضيع في النص!
🛰️ الموقف
تخيل كده تبقى قاعد شغال على كل فروعك والدنيا ماشية تمام، وفجأة تلاقي كل حاجة وقعت! الـVPN فصل، السيستم مش بيكلم بعض، وتبدأ تعمل ping تلاقي الـedge devices شايفين بعض… بس انت كـAdmin مش قادر تدخل على أي فرع تاني 😅 تقول: “طب نعمل trace كده يمكن نفهم؟” تلاقي الترافيك واصل لحد الراوتر على الـedge… وبعدين بيختفي تمامًا!
🧩 التشخيص
الغريب إنك تقدر تدخل على الفايروول من IP واحد بس، والباقي كله ميت. ولا غيرت Configurations، ولا حد لمس السيرفرات أصلًا. تتواصل مع الـNOC Team — يردوا بثقة:
“المشكلة عندك في الفايروول، إحنا شايفين الـrouters كلها بتكلم بعض عادي!”
وهنا تبدأ رحلة إثبات العكس 😂
تفتح الـSIEM وتبدأ تراجع الـflows بنفسك، تعمل ping بين فرعين باستخدام IPs مختلفة وتشوف المفاجأة:
الترافيك مش واصل للفايروول أصلًا!
🔍 السبب
ساعتها عرفت إن اللعبة كلها في الـrouting. طلبت الـRouting Table من الـNOC، وقعدت أراجعها واحدة واحدة… ولقيت الكارثة:
192.168.0.0/16 Static 60 0 RD 192.168.0.1 Vlanif1
بدل ما يكون المفروض يوجّه الترافيك للفايروول:
192.168.0.0/16 Static 60 0 RD 192.168.0.150 Vlanif1
يعني الترافيك كان بيرجع للـrouter نفسه بدل ما يروح للـfirewall، وده خلاه يضيع قبل ما يوصل للنقطة اللي المفروض تتحكم فيه.
🛠️ الحل
بدأت النقاش معاهم بهدوء، شرحت الـtopology عندي والـlogic بتاع الـfirewall كـgateway للتحكم في كل الترافيك. وبعد مكالمة طويلة وعدة اختبارات بـtraceroute وELK SIEM solution، تم التأكد من كل حاجة وتعديل الـconfigurations. وبعد ما وضحت للـNOC المشكلة وعدّلوا الـroute عشان يوجّه على IP الفايروول بدل الراوتر، بدأت كل الفروع تشتغل بشكل طبيعي 💪
💡 الدروس المستفادة
- في مشاكل الشبكات المعقدة، مش دايمًا العيب في أول حاجة بتخطر في بالك.
- راجع الـRouting، وافحص الـTraceroute بنفسك.
- لو عندك SIEM أو أي أداة Monitoring، صدقني هي هتتكلم بدل أي Logs.
- الهدوء والتحليل المنطقي أهم من السرعة في إصدار الأحكام.
🔧 الأدوات المستخدمة
- traceroute
- ELK SIEM
- Patience 😅