Могат ли стандартите за надеждност на оптичните модули/устройства на центъра за данни да бъдат смекчени?
Dec 11, 2025|
◆Изисквания за консумация на мощност на оптичния модул на центъра за данни
Разлики в работните среди на оптичните модули в телекомуникациите и центровете за данни
Има три основни разлики:
Различни работни температури
Телекомуникационните приложения изпитват дневни температурни вариации поради дневни температурни разлики, както и сезонни температурни вариации поради смяната на сезоните. Оптичните модули трябва да се адаптират към тези вариации. Телекомуникационните -приложения са разделени на вътрешна и външна среда. Вътрешната среда е 0~70 градуса, известна като търговска степен; външната среда обикновено изисква -40~85 градуса, обикновено известна като индустриален клас.
Центровете за данни са различни; технитеоптични модулитрябва само да преминат през температурен цикъл от 10 градуса, което е изключително стабилно.
Можем ли да намалим изискванията за тестове за надеждност при висока-температура и висока{1}}влажност, които изискваме всеки ден в центровете за данни?
Различни жизнени цикли на продукта
Приложенията-от телекомуникационен клас, веднъж внедрени, се очаква да издържат десетилетия; типичните жизнени цикли на надеждност са проектирани и оценени въз основа на 20 години.
Приложенията на центъра за данни обикновено се сменят на всеки две до три години.
Добре, значи правя нещо, което няма да се развали 50 години, но вие го използвате две години и след това го изхвърляте? Можем ли да намалим малко изискванията за продължителност на живота?

Различни дизайни на резервиране
Телекомуникационните приложения имат проекти за резервиране на линии, но резервирането не е голямо. Резервното комуникационно превключване се използва на критични линии. Често обаче чуваме новинарски съобщения за десетки хиляди потребители, засегнати от повреда на едно основно устройство, което се отразява на техните телефонни разговори и достъп до интернет. Накратко, неспособността на оптичните модули да функционират е критичен проблем. Центровете за данни имат много по-широко резервиране, особено след като над 90% от сървърите са облачни сървъри. Поради това потребителите почти не знаят за повреда на оптичен модул. За доставчиците, дори ако някои оптични модули се повредят произволно, те могат просто да бъдат заменени.
И така, могат ли изискванията за надеждност на оптичните модули да бъдат смекчени? От гледна точка на приложението облекчаването на изискванията за надеждност има малко въздействие върху клиентите. Следващият въпрос е: какво трябва да се отпусне? Как трябва да се отпусне? И защо трябва да се отпуска?
Основни повреди на компоненти и причини за повреда в оптични модули

Facebook публикува статистика за неуспехите за a100G оптичен модул, което показва, че 97% от повреди са-свързани с лазер, като повечето се случват в рамките на три месеца след първоначалната работа на лазера. Ако по-голямата част от отказите се появят в рамките на три месеца, трябва ли да се коригира определението за ранен отказ? Сред повредените лазери процентът на отказ на DFB (цифрови крушки) е значително по-висок от този на EML (електромагнитни ламинати) (няколкостотин пъти по-голям). Това повдига въпроса дали д-р Зенг от Facebook вярва, че DFB в режим на директна модулация са по-податливи на повреда от DFB, които излъчват светлина непрекъснато (точно както неподвижен проводник може да издържи дълго време, но многократното огъване лесно ще го счупи).
Следователно, за лазерите, които са основните цели за повреда, трябва ли тестването за надеждност да се увеличи на ниво лазерна пластина? Ако е свързано с режим на модулация, трябва ли дългосрочното -тестване през целия живот да включва проверка в режим на модулация?
Отпуснете изискванията за надеждност
Ако изискванията за надеждност трябва да бъдат смекчени, по-конкретно, трябва ли да намалим броя на тестовите елементи, да понижим условията на теста, да съкратим времето за тестване или да намалим броя на тестовите проби?
Намаляване на броя на тестовите елементи?
Всъщност няма много елементи от теста за надеждност. Дори ако един или два бъдат отстранени, те не са тестът за живот при висока температура и висока влажност, за който производителите на оптични модули се грижат. По-скоро те са някакви по-малко важни елементи. Намаляването на броя на тестовите задачи е смислено, но не особено значимо.
Намаляване на условията за тестване?
Това е възможно, но колко да се намали изисква анализ на данните, за да се намерят подходящите условия за тестване.

Време за тестване на компресия?
Какво ще кажете за 500 часа, не 5000 часа, не 2000 часа, не 1000 часа, а само 500 часа? По този начин тестовете за надеждност няма да причинят дълъг цикъл на стартиране на продукта.
Intel даде интересен отговор: въз основа на фактора на ускорение на GR468, 10-годишен живот може да бъде тестван за 6 седмици, като се използва фактор на ускорение 100x.
След това, ако увеличим температурата за тестване на надеждността до 130 градуса, коефициентът на ускорение става 1000x и 17-годишен живот може да бъде тестван за една седмица.
Това изглежда свива времето още повече, нали?
Можем ли да намалим дългото време за изпитване чрез увеличаване на размера на пробата, например 500 проби за 500 часа при висока температура и влажност?
Намаляване на размера на извадката за тестване на надеждността?
Broadcom има статистически анализ на отклонението в прогнозата за продължителността на живота, причинено от различни размери на извадката. Заключението е, че "без значение каква технология се използва, не може да се очаква да се намали броят на пробите, за да се постигне целта за намаляване на изискванията за надеждност", тъй като малкият размер на извадката сам по себе си въвежда отклонение.
Ако изискванията за надеждност трябва да бъдат смекчени, как трябва да се дефинира стандартът?
Преди 20 години GR468 беше еталон в индустрията за оптични комуникации. Всъщност имаше стандарт за надеждност, наречен GR3013 за кратки жизнени цикли още през 2004 г.
Този нов стандарт с облекчени изисквания за надеждност обаче е малко известен, поне аз съм чувал за него.
Този следобед големите производители все още използваха GR468 за анализ.
И така, трябва ли облекченият стандарт за надеждност да бъде напълно нова стандартна серия? Това носи риск от нещо подобно на GR3013 - индустрията прекарва дълго време в разработването на стандарти, а след това те остават неизвестни...
Вариант две: модифицирайте GR3013 и го приложете, след което го рекламирайте.
Вариант три: разработете по-щадяща версия на CR468, подходяща за центрове за данни.
Това е много специфичен проблем в индустриалната верига-как да го приложим?
Фундаменталният въпрос е: "Ако стандартите за надеждност бъдат облекчени, разходите ще бъдат ли намалени?"
За операторите на центрове за данни, какво печелят от облекчаване на изискванията за надеждност? Ниската цена е основната им цел. Лазерите имат най-висок процент на отказ. Въпреки това производители като Sumitomo и Broadcom, които произвеждат лазери, използват текст, формули и диаграми, за да предадат посланието, че облекчаването на изискванията за надеждност не намалява разходите. Всъщност това увеличава разходите, ако процесът за проверка на надеждността на лазерните пластини бъде модифициран.
При лазерите надеждността зависи от непрекъснатото технологично усъвършенстване. Облекчаването на изискванията за надеждност не е начин за намаляване на разходите. Както се казва в едно изречение в презентацията на Broadcom: „Помислете за други начини за намаляване на разходите...“


