Oszacowanie parametrów charakterystyk podatnych połączeń stalowych za pomocą sieci neuro-rozmytej.pdf

(442 KB) Pobierz
Microsoft Word - Jakubek_Pabisek_Waszczyszyn_got.doc
XLVIII KONFERENCJA NAUKOWA
KOMITETU INŻ YNIERII LĄ DOWEJ I WODNEJ PAN
I KOMITETU NAUKI PZITB
Opole – Krynica
2002
Magdalena JAKUBEK 1
Ewa PABISEK 2
Zenon WASZCZYSZYN 3
OSZACOWANIE PARAMETRÓ W CHARAKTERYSTYK
PODATNYCH POŁĄCZEŃ STALOWYCH
ZA POMOCĄ SIECI NEURO-ROZMYTEJ
1. Wprowadzenie, cel i zakres pracy
W normie europejskiej EC3 [1] zaproponowano proste modele charakterystyki M – F dla
połą czenia ‘rygiel-słup’, gdzie: M – przywę złowy moment zginają cy rygiel, F – wzajemny
ką t obrotu stycznych do osi rygla i słupa, schodzą cych się w węźle. Parametry modelu
charakterystyki mają być wyznaczone na podstawie wynikó w badań doświadczalnych na
materialnych modelach laboratoryjnych.
Tą drogą poszły pró by zastosowania sztucznych sieci neuronowych do identyfikacji
parametró w modeli proponowanych w EC3, opierają ce się na bankach danych doświad-
czalnych [2-6]. Niestety, wyniki tych prac nie zakończyły się znaczą cym powodzeniem.
Głó wnym powodem były mało reprezentatywne badania, ograniczane do niepowtarzalnych
doświadczeń na mało licznych zbiorach połą czeń. Prowadziło to do wynikó w o niskiej
dokładności predykcji neuronowej.
W naszym referacie podejmujemy pró bę ponownej analizy problemu wyznaczania
parametró w prostej biliniowej charakterystyki ale nie w odniesieniu do wartości ostrych lecz
rozmytych w sensie wartości przedziałowych. W tym celu zbudowano sieć jednokierunkową
o parametrach rozmytych, opierają c się na metodzie zaproponowanej w [7]. Metoda polega
na uczeniu sieci na oddzielnych wzorcach celem wyznaczenia funkcji przynależności dla
parametró w sieci jednokierunkowej.
Tak otrzymaną sieć neuro-rozmytą zastosujemy do wyznaczenia przedziałowych war-
tości parametró w grupy 30 połą czeń analizowanych w [4].
2. Sieć neuro-rozmyta
Różnego typu sieci neuro-rozmyte są omawiane w [9]. W naszym referacie zajmujemy się
siecią o parametrach rozmytych, a wię c siecią , któ ra może odwzorowywać rozmyte wartości
1 Mgr inż., Wydział Inżynierii Lą dowej Politechniki Krakowskiej
2 Dr inż., Wydział Inżynierii Lą dowej Politechniki Krakowskiej
3 Prof. dr hab. inż., Wydział Inżynierii Lą dowej Politechniki Krakowskiej
76290670.005.png
70
wejść w rozmyte wartości wyjść , ale też dla ostrych wejść dawać rozmyte wyjścia. Uczenie
takiej sieci za pomocą operacji na zbiorach rozmytych jest bardzo trudne i ze wzglę du na
efektywność numeryczną wymaga znacznych uproszczeń modelu, np. w odniesieniu do
przyjmowanych funkcji przynależności [9].
Z tych powodó w oparliśmy się na pomyśle algorytmu zaproponowanego w [6]. Polega
on na wstę pnym uczeniu sieci na zbiorze wzorcó w uczą cych:
L = {( x ( p ) , z ( p ) ) | p = 1,..., L } . (1)
Po nauczeniu sieci zbió r parametró w sieci (wartości wag synaptycznych i wartości
progowych ), oznaczony w skró cie jako { w i o | i = 1,..., LPS } gdzie LPS jest liczba paramet-
ró w sieci, przyjmujemy jako zbió r parametró w począ tkowych do uczenia sieci dla kolejnych
wzorcó w p = 1,..., L . Obliczone parametry służą do wyznaczania funkcji zależności dla
parametró w sieci i = 1,..., LPS .
Algorytm budowania sieci neuro-rozmytej omó wiono szczegółowo w [10]. Składa się
on z trzech etapó w. W Etapie I sieć jest uczona na całym zbiorze uczą cym (1). Ten etap jest
poprzedzony etapem wstę pnym projektowania sieci, por. [10]. W Etapie II proces uczenia
jest powtarzany L razy, kolejno dla każdego wzorca uczą cego p . Po obliczeniu zbioru
parametró w { w i ( p ) p =1,..., L ; i =1,..., LPA }. W Etapie III obliczamy funkcje przynależności
m i = m ( w i ) dla wszystkich parametró w sieci i . Dochodzimy w ten sposó b do sieci rozmytej,
któ ra po pozytywnym sprawdzeniu na zbiorze testują cym może być używana w etapie
operacyjnym do predykcji neuronowej dla innych zbioró w niż wcześniej wykorzystane
zbiory uczą cy i testują cy.
W [11] omó wiono dwie metody obliczania funkcji przynależności. Prostsza metoda,
wzię ta z [6], zakłada funkcje tró jką tne, por. rys. 1a (t), gdzie długości podstaw y s ą obliczone
dla standardowych odchyleń s L i s R odmierzanych od wartości średniej w , gdzie dla
uproszczenia pominię to indeks i parametru sieci. Przekroje a odpowiadają wartości przyna-
leżności i wartości przedziałowych [ w L , w R ] a = [ w L a , w R a ] .
Rys. 1. Funkcje przynależności parametru sieci neuro-rozmytej:
a) funkcja tró jką tna (t), b) funkcja nieliniowa (n)
Druga metoda wyznaczania nieliniowej funkcji przynależności parametró w sieci, por.
rys. 1a (n), polega na liczeniu empirycznej dystrubuanty dla parametró w w min £ w ( p ) < w
oraz w £ w ( p ) £ w max . Numery wzorcó w w L a i w R a obliczamy z nieró wności:
76290670.006.png
 
71
( 1- 2 K / L ) £ a < ( 1- 2 ( K- 1) / L ) , (2)
gd zie: K = k L a , k R a – numery parametró w liczone na lewo lub na prawo od wartości średniej
w . Jeśli zajdzie przypadek, że a ˛ ( K- 1 , K ) to wartości w L a , w R a są obliczane z
interpolacji liniowej wartości z przedziału ( w K-1 , w K ), por. [11].
Po wyznaczeniu funkcji przynależności dla każdego parametru sieci możemy ją
wykorzystać dla obliczania wartości przedziałowych wyjść [ y L , y R ] a dla ustalonej wartości
przekroju a . Zmieniają c wartości a możemy odtworzyć funkcje przynależności wyjść . Na
skutek rozmycia parametró w sieci, rozmyte wyjścia otrzymamy nie tylko dla rozmytych ale
też ostrych wejść . Po wprowadzeniu wartości przedziałowych składowych wektoró w wejść
[ x j L , x j R ] dalej są wykonywane działania na nich zgodnie z rachunkiem przedziałowym [9].
W przypadku ostrych wartości wejść dla wszystkich a przyjmujemy x j L , = x j R .
3. Dane doświadczalne
Z obszernego banku danych Sericon, zgromadzonego w RWTH Aachen [8], przyję to zbió r
30 połą czeń analizowanych w [4]. Na rys. 2a pokazano konstrukcję połą czenia, określonego
6-ma parametrami, któ re przyję to jako składowe wektora wejścia x . Na rys. 2b pokazana
jest krzywa doświadczalna (d) charakterystyki M - F jednego z analizowanych połą czeń.
Aproksymację liniową (b) wykonano w [4] przez obliczenie takich wartości F Rd , M Rd i F Cd
, któ re dają równość powierzchni D 1 = D 2 zawartych mię dzy krzywymi (a) i (b). W [4]
przytoczono tablicę z 6-ciu danymi i obliczonymi 3-ma parametrami aproksymacji
biliniowej dla wszystkich wartości 30-tu połą czeń.
Rys. 2. a) Analizowane połą czenie, b) Charakterystyki M - F połą czenia:
(d) krzywa doświadczalna, (b) aproksymacja biliniowa
4. Aproksymacja neuronowa
Tak samo jak w [4] przyję to wektory wejścia i wyjścia o nastę pują cych składowych, por.
rys. 2a:
x (6x1) = {
h
c
,
t
f
,
t
w
,
h
b
,
b
,
a
f
}
, y (3x1) = {
M
Rd
,
Φ
Rd
,
Φ
Cd
}
, (3)
76290670.007.png
72
gdzie wszystkie składowe ( ) przeskalowano do przedziału (0, 0.9).
W dalszym cią gu zajmujemy się tylko jednym przypadkiem, oznaczonym [4] jako
przypadek II/3, w któ rym zbió r testują cy składał się z połą czeń o numerach 9, 17, 29, a
pozostałe 27 połą czeń tworzą zbió r uczą cy. Do uczenia zbioru wstę pnych parametró w sieci
{ w i o } oraz zbioru parametró w dla indywidualnych wzorcó w { w i ( p ) }, t.zn. do realizacji Eta-
pó w I i II algorytmu omowionego wyżej w p. 1, zastosowano sieć 6-7-3 o sigmoidalnych
neuronach w warstwie ukrytej i wyjściowej. Posługują c się symulatorem [12] zastosowano
do uczenia sieci metoda Levenberga-Marquardta (LM). Błą d aproksymacji mierzono miarą :
1 V 3
RMS ( V ) = ( ( z j ( p - y j ( p ) ) 2 ) 1/2 , (4)
V p =1 j =1
gdzie: z j ( p ) , y j ( p ) – przeskalowane znane i obliczone siecią wartości wyjść j dla wzorca p ,
V = L , T , P – liczba elementó w w zbiorach uczą cym i testują cym oraz pełnym zbiorze P =
L + T .
Uczenie w Etapie I wymagało mniej niż 100 epok aby osią gnąć dokładność rzę du
RMS ( L ) » 1 10 -3 . Uczenie w Etapie II wymagało ok. 20 epok aby osią gnąć dokładność
RMS ( p ) » 1 10 -6 . W Tabl. 1 zestawiono błę dy Etapu I i Etapu II dla przekroju a = 1.0 ,
określane wzorami:
1
V
avr epV j = =
ep
, max epV j = max { ep j p =1,..., V } , (5)
j
V
p
1
dla ep j = ‰1- y j ( p ) / z j ( p ) ‰· 100% .
W tablicy przytoczono też wartości współczynnika korelacji r P obliczonego dla wszystkich
par ( y j ( p ) , z j ( p ) ) całego zbioru P = 30 połą czeń.
Tablica 1. Błę dy neuronowej predykcji
Sieć
6-7-3
Błę dy sieci
RMS ( V ) · 10 2
Błę dy wzglę dne [%]
dla V = P :
M - Rd
Współczynnik
korelacji r P
dla :
V = T avr max avr max avr max M-Rd Phi-Rd Phi-Cd
Etap I 3.09 18.87 5.22 27.33 6.42 33.20 5.41 40.13 0.988 0.997 0.977
a=1.0 8.96 17.28 10.89 23.29 8.64 24.04 15.68 34.46 0.987 0.988 0.989
V = L
Phi - Rd
Phi - Cd
W tablicy podano błę dy dla wstę pnego uczenia sieci na wszystkich wzorcach (Etap I).
W nastę pnym wierszu zestawiono błę dy dla sieci rozmytej i przekroju a = 1.0 . Widać , że
średnie błę dy wzglę dne są wyższe dla sieci rozmytej ale obniżają się błę dy maksymalne.
Dokładność obliczania momentu M Rd i obrotu F Rd jest wię ksza niż granicznego obrotu F Cd
Na rys. 3 pokazano funkcje przynależne funkcji wyjściowych dla y j ( p ) = M Rd , F Rd , F Rd
dla wzorcó w testują cych p = 9, 17, 29. Funkcje przynależności pokazano przy założeniu
funkcji przynależności wag parametró w sieci o kształtach tró jką tnych (t) i nieliniowych (n),
por. rys. 1. Na rysunkach zaznaczono przez punkty odpowiadają ce wartościom przedzia-
łowym dla przekrojó w a = 0.0, 0.25, 0.75, 0.9, 1.0. Przez zaznaczono położenie znanych
wartości wyjściowych z j ( p ) . Wyniki dla funkcji przynależności (t) są bliskie wynikó w otrzy-
76290670.001.png 76290670.002.png 76290670.003.png
73
manych za pomocą funkcji (n) dla przekroju a = 0.9. Dlatego dalszy rysunek jest wyko-
nany dla funkcji (t) i przekrojó w a = 1.0 i 0.9 .
Rys. 3. Funkcje przynależności dla wielkości wyjściowych M Rd , F Rd i F Cd
dla połą czeń 9, 17, 29 przy posługiwaniu się funkcjami przynależności parametró w
sieci oznaczonymi przez: (t) , (n) --◊--◊-- ; - wartość doświadczalna
76290670.004.png
Zgłoś jeśli naruszono regulamin