Narzędzia sztucznej inteligencji przenikają obszar zarządzania siecią telekomunikacyjną. Bez nich pewne rzeczy w ogóle nie byłyby możliwe, a inne byłyby znaczniej mniej zaawansowane lub znacznie bardziej pracochłonne. Przez planowanie inwestycji, przez odbiory budowanej sieci po prognozowanie ruchu i przeciwdziałania awariom ‒ o tym, jak AI wspiera zarządzanie siecią, rozmawiamy z Radkiem Kozą z Orange Polska, w ramach cyklu „AI w telekomunikacji”, który realizują wspólnie GSMONLINE.PL i TELKO.in.
RADEK KOZA, dyrektor Centrum Zarządzania Usługami Orange Polska: Operatorzy potrzebują dobrze działających i efektywnych usług. Czy do tego są potrzebne procesory graficzne? Dzisiaj jeszcze nie. Z czasem ich rola będzie jednak rosła, bo wykorzystanie narzędzi AI w sieci telekomunikacyjnej jest koniecznością. Tendencja będzie się utrwalać, co podniesie zapotrzebowanie na moce obliczeniowe.
Odpowiadając na tak postawione pytanie, najprościej jest skupić się na utrzymaniu sieci: na automatycznym wykrywaniu anomalii i przeciwdziałaniu im, ale przecież cykl życia infrastruktury nie od tego się zaczyna.
Początkiem jest optymalne planowanie procesu inwestycyjnego. Szczególnie w przypadku takiego operatora jak Orange Polska, którego sieć jest konwergentna, który musi analizować istniejący i przyszły popyt na usługi, i dla którego ważne jest to, na jakiej platformie technologicznej najlepiej ten popyt zaspokoić. Takie analizy oparte są nie tylko na (najbardziej oczywistych) danych o ruchu w sieci i jego zmianach, ale także na źródłach całkowicie niezależnych od operatora.
Przede wszystkim na informacjach, które dotyczą demografii i rozwoju infrastruktury w Polsce. Inwestycje w sieć, zwłaszcza mobilną, liczy się nie w tygodniach, ale w miesiącach i w latach. Planuje się je przez pryzmat rozwoju osiedli mieszkaniowych, obiektów biznesowych, budowy autostrad i innych szlaków komunikacyjnych, jak linie kolejowe. Wyjątkowym przypadkiem jest planowanie i budowa Centralnego Portu Komunikacyjnego. Analizujemy plany i przewidywane zapotrzebowanie na usługi telekomunikacyjne ‒ stacjonarne i mobilne.
Umiemy. Agregując je z informacjami z innych źródeł ‒ także własnych ‒ budujemy plany inwestycyjne, aby zmaksymalizować ich efektywność. Nie jest sztuką zbudować pokrycia każdego punktu geograficznego każdą możliwą technologią (co zresztą nie wszędzie jest potrzebne). Sztuką jest analiza bieżących i przyszłych potrzeb, i budowa właśnie tego, na co aktualnie jest zapotrzebowanie ‒ z zachowaniem możliwości rozbudowy w przyszłości.
Proszę bardzo. Czy w danej lokalizacji lepiej wybudować trzy wieże mobilne z sygnałem 5G w paśmie 3400-3800 MHz, co da dużą pojemność sieci mobilnej, czy może lepiej wybudować jedną wieżę z sygnałem 5G w paśmie zasięgowym (np. 800 MHz), ale jednocześnie budować tam stacjonarną sieć światłowodową.
Potrzebują i dostaną go w satysfakcjonującej jakości w paśmie 800 MHz. Nie będziemy im natomiast dostarczać w tym paśmie internetu domowego 5G/LTE, bo podłączymy światłowód.
Warto pamiętać, że czym innym jest zasięg, a czym innym pojemność sieci. Przysłowiowe pięć kresek zasięgu to gwarancja płynnej rozmowy, ale niekoniecznie płynnego streamingu, jeżeli z tego samego nadajnika korzysta 50 domostw równocześnie. Rzeczywistość sieci mobilnej jest taka, że 5-10 proc. użytkowników zużywa 50-80 proc. dostępnej pojemności.
Tak to może wyglądać. Tutaj „więcej” nie znaczy „lepiej”. Efektem analizy może być rekomendacja dla inwestycji mobilnej, ale z dużą pojemnością sieci. Pod uwagę bierzemy nie tylko to, co sami możemy budować. Nie jest tajemnicą, że na dużą skalę korzystamy z sieci światłowodowej budowanej przez inne firmy. Ich plany, jeżeli są dostępne, także są elementem naszej analizy. Możemy uwzględnić sieci powstające w ramach publicznych programów, czy nawet opcję przejęcia istniejącej infrastruktury na interesującym nas obszarze.
Tak, to jeden system, co prawda powstały na bazie kilku różnych narzędzi, który nazywamy Matrix.
Tak ‒ w zakresie jaki wydaje nam się uzasadniony. Nie wdrażamy sztucznej inteligencji dla sztuki, tylko tam, gdzie daje efekty. Nadal są obszary, w których lepiej sprawdzają się czynności manualne, czy prognozowanie szeregów czasowych.
Te wszystkie narzędzia pomagają nam optymalnie zaplanować inwestycje pod kątem potrzeb klientów, niezbędnych nakładów i czasu zwrotu z tych inwestycji.
Zasada jest trochę inna ‒ oparta raczej na priorytetyzacji zadań. Musimy zdecydować, jakie działania inwestycyjne podjąć i w jakiej kolejności ‒ mieszcząc się w zaplanowanym budżecie. Opłacalność inwestycji jest podstawowym parametrem, chociaż nie jedynym. Są i inne priorytety, jak realizacja podjętych zobowiązań (np. z tytułu rezerwacji radiowych), czy wzmocnienie relacji z kluczowym klientem.
Opłacalność inwestycji jest kalkulowana w pełni automatycznie. Na marginesie ‒ z uwagi na masę danych do przetworzenia, jest to czaso- i zasobochłonny proces ‒ obliczenia potrafią trwać tydzień. W każdym razie efektem jest lista możliwości inwestycyjnych, ale ostateczną decyzję podejmuje człowiek. Są przecież także okoliczności, które trudno uwzględnić w algorytmie, np. to że w miejscu wskazanym do budowy wieży telekomunikacyjnej nie ma gruntu do wydzierżawienia.
Kiedyś, naprawdę już dość dawno temu, wszystkie te czynności realizowane były manualnie. To działało, ale nakład pracy był bardzo duży, mniej danych można było uwzględnić i niższa była precyzja analizy.
Trzeba to rozpatrywać na kilka sposobów. Pierwszym jest utylizacja wybudowanej sieci, czyli ile sprzedajemy na niej usług. Kolejna sprawa to statystyki ruchu sieciowego na optymalnym poziomie. No i wreszcie kwestia pieniędzy, jakie wydajemy na niezbędne inwestycje.
Ja bym powiedział, że dzięki AI osiągamy znacznie lepsze efekty przy podobnych nakładach.
Dobrym, a nieoczywistym przykładem jest zarządzanie akumulatorami do podtrzymywania działania nadajników sieci mobilnej. Analiza oparta na narzędziach AI pozwoliła nam zidentyfikować te lokalizacje, których ‒ odpowiednio długie ‒ podtrzymanie zapewni najlepszy efekt, jeżeli chodzi o dostępność sieci. Jeżeli do tego inteligentnie zarządzimy dostawami energii elektrycznej, to jeszcze oszczędzimy na utrzymaniu tych lokalizacji.
Kolejny etap, to budowa sieci i tutaj nowoczesne narzędzia także się przydają. Najbardziej jaskrawy przykład to odbiory inwestycji. Dzisiaj nie trzeba już wszystkiego mierzyć ręcznie. Można automatycznie sprawdzać właściwe azymuty anten radiowych, właściwe etykiety na kablach itp.
Zamawiając u wykonawcy odpowiednią dokumentację zdjęciową ze wskazaniami na urządzeniach pomiarowych. System potrafi sprawdzić autentyczność zdjęcia, a potem odczytać wartości parametrów. To samo z inwestycjami stacjonarnymi. System sprawdzi czas i lokalizację zdjęcia z danym odcinkiem sieci, ułożenie taśmy ostrzegawczej itp.
Zdarzają się, ale automatyzacja pozwala je wyłowić, znacznie zwiększa poziom kontroli i ogranicza konieczność działań w terenie.

Potem dochodzimy do procesu utrzymania sieci i tutaj zastosowań AI jest oczywiście najwięcej. Sieć ma przede wszystkim działać w sposób nieprzerwany, więc podstawową kwestią jest monitorowanie. Budujemy teraz tzw. Smart NOC [Network Operations Center ‒ red.], który zbiera informacje o działaniu sieci.
To jest wizja pożądana, ale tylko w obszarze najbardziej standardowych i najliczniejszych zdarzeń. Nie bardzo wyobrażam sobie eliminację człowieka w sytuacjach, które wymykają się rutynie, albo w zdarzeniach obarczonych wysokim ryzykiem. Tutaj raczej nie zaufamy w pełni AI.
Bez wątpienia. Dlatego najlepiej się sprawdza podejście typu „podwójna weryfikacja” ‒ mniej potrzebna na poziomie rutynowych zdarzeń, a znacznie bardziej na poziomie zdarzeń okazjonalnych i obarczonych dużym ryzykiem. Podwójna weryfikacja ma największą efektywność, gdy jest hybrydowa: człowiek zatwierdza propozycję automatu, albo automat weryfikuje rozwiązanie aplikowane przez człowieka.
W Orange monitorujemy warstwę sieciową, czyli infrastrukturę i urządzenia, oraz warstwę usługową, czyli alarmy od klientów. Tych alarmów są miliony, ale nie wszystkie prawdziwe, więc trzeba je odsiać. Potem należy skorelować alarmy z incydentami sieciowymi. W uproszczeniu ‒ przecięcie kabla światłowodowego w jednym miejscu „kładzie” trzy stacje mobilne, cztery węzły sieci xDSL, jeden węzeł sieci światłowodowej, siedzibę główną klienta kluczowego i jeszcze dostęp dla klienta hurtowego. AI bardzo nam pomaga w analizie związków pomiędzy takimi zdarzeniami, eliminacji fałszywych alarmów itp.
Tak. W przypadku przecięcia kabla jest dosyć prosto. Gorzej może być z awarią urządzenia IP ‒ to się ciężej diagnozuje. Kolejna sprawa, to perspektywa klienta, dla którego usługa ma być po prostu dostępna, stabilna i odpowiednio wydajna. Sztuczna inteligencja bardzo nam pomaga w analizie tych zależności i w znalezieniu realnej przyczyny komunikatu od klienta „internet mi nie działa”. Odpowiedzią na taki komunikat może być likwidacja awarii, poprawa konfiguracji urządzenia sieciowego albo (nawet) nowa inwestycja sieciowa.
Podstawowy parametr, to czas niedostępności (lub niewystarczającej wydajności) usługi dla klienta.
Wolałbym nie operować na dokładnych wartościach, bo to są dane wrażliwe. Mogę powiedzieć, że blisko 100 proc. zdarzeń (awarii) jest wykrywanych i likwidowanych przed zgłoszeniem od klienta. Wdrożenie nowoczesnej analityki oraz automatyzacja środków zaradczych podnosi wskaźniki o pojedyncze punkty procentowe. Im bliżej wartości 100 proc., tym trudniej optymalizować. To pozornie nie wygląda spektakularnie, ale w skali dużej sieci to ma bardzo konkretne przełożenie na doświadczenie klienta końcowego. Widać związek pomiędzy wzrostem wskaźnika eliminacji awarii a wzrostem wskaźnika NPS w badaniach naszych klientów.
Zgadza się. Utrzymujemy i podnosimy jakość na ‒ co podkreślam ‒ coraz rozleglejszej i coraz bardziej złożonej sieci, starając się działać tymi samymi ekipami specjalistów. W sieci mobilnej kiedyś operowaliśmy na kilku tysiącach komórek, a dzisiaj operujemy na kilkuset tysiącach, jeżeli liczyć kolejne technologie na nowych zakresach radiowych. Każda operacja sieciowa jest dzisiaj bardziej złożona niż kiedyś. Systemy telekomunikacyjne są znacznie bardziej złożone, wymagają znacznie więcej konserwacji niż kiedyś. To jest cena za wzrost elastyczności i upodobnienie dawnych systemów zamkniętych do otwartości środowiska IP. Dwa lata temu realizowaliśmy 100 tys. prac planowych na sieci rocznie. Teraz realizujemy ponad 200 tys.
Bez narzędzi AI to w ogóle nie byłoby możliwe na taką skalę. Ograniczamy wzrost zatrudnienia, ale ludzie wciąż są potrzebni i to się nie zmieni w dającej się przewidzieć przyszłości.
Bez tych narzędzi w ogóle byśmy nie dostrzegali części zdarzeń. Liczba alarmów może nie spadać, a rosnąć, ponieważ pewne anomalie do tej pory w ogóle nie były wykrywane, my udzielaliśmy klientom niekoniecznie właściwych odpowiedzi, a nasze wysiłki utrzymaniowe szły w niekoniecznie właściwym kierunku.
Kolejna sprawa to wyprzedzająca optymalizacja sieci. Sztuczna inteligencja pozwala nam znacznie lepiej dopasować konfiguracje urządzeń do lokalnej specyfiki sieci. Wcześniej dominowały standardy ‒ z konieczności, bo inaczej trudno byłoby zapanować nad tak wielką siecią. Dzisiaj, dzięki AI, możemy być znacznie bardziej elastyczni.
W cyklu życia urządzeń sieciowych nie należy też zapominać o wyłączeniach urządzeń. Dzisiaj w Orange Polska stopniowo eliminujemy sieć miedzianą. Nowoczesna analityka pomaga nam oszacować, w których miejscach jest to najbardziej uzasadnione ekonomicznie i priorytetowe, a w których wręcz przeciwnie, ponieważ korzystanie wciąż jest intensywne, a inwestycja w alternatywne technologie mało opłacalna.
Szacunki były mniej precyzyjne. W miarę łatwo jest liczyć koszty samej sieci dostępowej, ale znacznie trudniej koszty na dalszych odcinkach sieci jak dystrybucja, magistrala, czy transport. AI znacznie lepiej sobie radzi z wiarygodną kalkulacją całościowych kosztów.
Wszystko co się dzieje w radiodostępie, w warstwie sieciowej ‒ bo usługi to inna sprawa ‒ wymaga uzgodnień z partnerem.
Wymaga uzgodnień, co bywa niekiedy trudne. Ale daje także dodatkowe szanse, bo możemy korzystać z doświadczeń dwóch dużych europejskich operatorów telekomunikacyjnych.
W obszarze sieci korzystamy z generatywnych narzędzi.
Duże modele językowe [LLM] z definicji są dobrze wyposażone w wiedzę o sieciach telekomunikacyjnych. Lokujemy je na własnych serwerach i uzupełniamy o realne dane z własnej sieci. Jeżeli te dane dotyczą klientów, to bardzo starannie pilnujemy, by pozostały wyłącznie w naszych zasobach.
Mamy takie rozwiązanie. Z wykorzystaniem dowolnego modelu językowego można w taki mniej więcej sposób zarządzać siecią. Nie robimy tego na sieci RAN, więc nie stosujemy komend „BTS-sie, włącz się!”. Korzystamy natomiast z takich możliwości w obszarze sieci rdzeniowej 5G. Ona jest do tego doskonale przygotowana, ponieważ z natury ma charakter warstwowy, oparty na rozwiązaniach chmurowych. Jak na razie nie rozmawiamy z nią, tylko piszemy prompty (chociaż interfejs głosowy to teoretycznie prosta sprawa). Takim promptem można zlecić wygenerowanie w pełni funkcjonalnej sieci rdzeniowej o pojemności określonej dla danej liczby użytkowników. I system automatycznie taką sieć stworzy.
Inżynier telekomunikacji jest potrzebny, ponieważ ktoś musi napisać odpowiedni prompt dla AI i zweryfikować efekt. Natomiast rzeczywiście nie musi sam siedzieć i pisać skryptu, który tę sieć wygeneruje. Dużo „rzemieślniczej” wiedzy i czynności może przejąć narzędzie AI.
W tej drodze jesteśmy dopiero na początku. Postawiliśmy sobie cele zbliżone do pięciostopniowego procesu automatyzacji opisanego przez Telemanagement Forum, gdzie 0 to brak jakiejkolwiek automatyzacji, a 5 to całkowita autonomia sieci.
Uśredniając, to na poziomie 3 i w drodze na 4. Gdyby spojrzeć na konkretne obszary sieci, to może być 1,5, a może być i 4. Niektóre obszary mogą się wydawać opóźnione, ale wcale nie zamierzamy z tym walczyć. Są bowiem obszary technologii schodzących, które prędzej stracą przydatność, niż my je zautomatyzujemy. Są także obszary na poziomie 4 w całym spektrum standardowych zdarzeń i działań. Gdy chodzi o zdarzenia i procedury niestandardowe, to ‒ jak już mówiłem wcześniej ‒ nie spieszymy się z automatyzacją. Do każdego „robota” opracowujemy szacunek ryzyka związanego z nieprawidłowym działaniem i to także wpływa na tempo wdrożenia.
W sieci rdzeniowej korzyści z automatyzacji są niewielkie, podczas gdy ryzyko jest ogromne. W sieci dostępowej jest na odwrót: elementów sieci jest mnóstwo, ale potencjalna awaria dotyczy niewielkiej liczby użytkowników. W sieci rdzeniowej notujemy od kilku do kilkudziesięciu awarii miesięcznie. W sieci dostępowej liczba incydentów przekracza 100 tys. ‒ tutaj będziemy więc bardzo mocno stawiali na automatyzację; nawet do poziomu 5.
Przy aktualnie eksploatowanych technologiach trudno to jeszcze uznać za konkretny cel.
Chodzi o autoutrzymanie i autonaprawę sieci we wszystkich incydentach, które nie mają fizycznego charakteru. I to znowu zależy od platformy technologicznej, bo na przykład w 5G relatywnie łatwo to osiągnąć. Fizyczny wymiar sieci rdzeniowej 5G, to serwer. W sieci dostępowej, to antena i kable transmisyjne. Reszta jest oprogramowaniem, z którym wiele można zrobić automatycznie.
Przy aktualnym tempie rozwoju, to będzie początek lat 30. W praktyce znacznie ważniejszy jest poziom 4, ponieważ on automatyzuje reagowanie na wszystkie standardowe zdarzenia sieciowe, a takich zdarzeń jest najwięcej. Tutaj, w zależności od technologii, mówimy o 1-3 latach.
W pewnym stopniu tak, ale nie jest to przełom. Z natury chmurowego charakteru 5G łatwiej się temu poddaje, ale czy działa na własnym rdzeniu, czy na rdzeniu LTE, to nie jest aż tak istotne. Na marginesie ‒ równie podatne byłoby LTE, gdyby je wdrażać w środowisku Open-RAN.
Nie ma dzisiaj na rynku kryterium „gotowości na AI”, jeżeli chodzi o sprzęt sieciowy. Jeżeli natomiast chodzi o rozwiązania do zarządzania siecią, jakie dostarczają czołowi dostawcy sprzętu, to dzisiaj żadnego nie nazwałbym liderem AI. Tak samo jak my, oni dopiero się uczą. Testowaliśmy pewne rozwiązania od vendorów sprzętu, ale okazały się tak zachłanne na zasoby obliczeniowe, że to by się nigdy nie opłacało w utrzymaniu.
Należymy do liderów wdrażania koncepcji autonomous network. W Polsce działa bardzo silny ośrodek R&D, który pracuje nad rozwiązaniami sieciowymi i nad zastosowaniami AI. Wspomniana platforma Matrix będzie stanowić podstawę dla rozwiązania wdrażanego w całej grupie. Telco AI Assistant ‒ rozwiązanie, które pozwala zarządzać siecią za pośrednictwem języka naturalnego, także zostało opracowane w Polsce.
Polska jest dużym rynkiem, a organizacja jest biznesowo elastyczna. To ułatwia wdrażanie innowacyjnych rozwiązań. Wiele ciekawych pomysłów pojawia się także w Rumunii, a ostatnio również w Hiszpanii po połączeniu Orange z MasMovil. Hiszpanie obiecują pokazać metodę opisu sieci za pomocą grafów, co może bardzo ułatwić śledzenie zależności zdarzeń sieciowych i wdrażanie automatycznych rozwiązań utrzymaniowych (ang. self-healing).
Według mnie to jedna z najciekawszych innowacji, jakie ostatnio pojawiły się na horyzoncie. Druga ‒ już działająca, ale rokująca jeszcze więcej na przyszłość ‒ to metoda zarządzania siecią za pośrednictwem języka naturalnego.
To też, ale w praktyce pewnie częściej: „coś niedobrego dzieje się w sieci mobilnej w Szczecinie, co to może być?”; albo: „za tydzień Marsz Niepodległości, zoptymalizuj sieć na to wydarzenie”.
Rozmawiali: Łukasz Dec i Wojciech Piechocki