Linearna regresija. Korištenje metode najmanjih kvadrata (LSM). Aproksimacija eksperimentalnih podataka. Metoda najmanjih kvadrata Metoda najmanjih kvadrata u slučaju 3 varijable

Koja nalazi najširu primenu u raznim oblastima nauke i prakse. To može biti fizika, hemija, biologija, ekonomija, sociologija, psihologija i tako dalje i tako dalje. Voljom sudbine često moram da se bavim ekonomijom i zato ću danas za vas organizovati kartu za neverovatnu zemlju tzv. Ekonometrija=) … Kako to ne želiš?! Tamo je jako dobro - samo morate odlučiti! …Ali ono što sigurno želite je naučiti kako rješavati probleme najmanjih kvadrata. A posebno marljivi čitaoci naučiće da ih rešavaju ne samo precizno, već i VEOMA BRZO ;-) Ali prvo opšta izjava o problemu+ povezani primjer:

Neka se proučavaju indikatori u nekoj predmetnoj oblasti koji imaju kvantitativni izraz. Istovremeno, postoje svi razlozi za vjerovanje da indikator ovisi o indikatoru. Ova pretpostavka može biti i naučna hipoteza i zasnovana na elementarnom zdravom razumu. Ostavimo, međutim, nauku po strani i istražimo privlačnija područja – naime, trgovine prehrambenim proizvodima. Označiti sa:

– maloprodajni prostor prehrambene radnje, m2,
- godišnji promet trgovine prehrambenim proizvodima, milion rubalja.

Sasvim je jasno da što je veća površina radnje, veći je njen promet u većini slučajeva.

Pretpostavimo da nakon provođenja promatranja / eksperimenata / proračuna / plesa s tamburom imamo na raspolaganju numeričke podatke:

Sa prehrambenim prodavnicama mislim da je sve jasno: - ovo je površina 1. prodavnice, - njen godišnji promet, - površina 2. prodavnice, - njen godišnji promet itd. Usput, uopće nije potrebno imati pristup povjerljivim materijalima - prilično tačna procjena prometa može se dobiti pomoću matematičke statistike. Međutim, nemojte se ometati, kurs komercijalne špijunaže je već plaćen =)

Tabelarni podaci se također mogu zapisati u obliku tačaka i prikazati na uobičajen način za nas. Kartezijanski sistem .

Odgovorimo na jedno važno pitanje: koliko bodova je potrebno za kvalitativnu studiju?

Što veće, to bolje. Minimalni dozvoljeni skup se sastoji od 5-6 bodova. Osim toga, s malom količinom podataka, “nenormalni” rezultati ne bi trebali biti uključeni u uzorak. Tako, na primjer, mala elitna radnja može pomoći redovima veličine više od "njihovih kolega", čime se iskrivljuje opći obrazac koji treba pronaći!

Ako je sasvim jednostavno, moramo odabrati funkciju, raspored koji prolazi što bliže tačkama . Takva funkcija se zove aproksimativno (aproksimacija - aproksimacija) ili teorijska funkcija . Uopšteno govoreći, ovdje se odmah pojavljuje očigledan "pretendent" - polinom visokog stepena, čiji graf prolazi kroz SVE tačke. Ali ova opcija je komplikovana i često jednostavno netočna. (jer će grafikon stalno "vijati" i loše odražavati glavni trend).

Dakle, željena funkcija mora biti dovoljno jednostavna i istovremeno adekvatno odražavati ovisnost. Kao što možete pretpostaviti, jedna od metoda za pronalaženje takvih funkcija se zove najmanjih kvadrata. Prvo, analizirajmo njegovu suštinu na opći način. Neka neka funkcija aproksimira eksperimentalne podatke:


Kako ocijeniti tačnost ove aproksimacije? Izračunajmo i razlike (odstupanja) između eksperimentalne i funkcionalne vrijednosti (učimo crtež). Prva misao koja vam pada na pamet je procijeniti koliki je iznos, ali problem je što razlike mogu biti negativne. (Na primjer, ) a odstupanja kao rezultat takvog zbrajanja će se poništiti. Stoga, kao procjenu tačnosti aproksimacije, predlaže se uzeti zbir moduli odstupanja:

ili u presavijenom obliku: (odjednom, ko ne zna: je ikona zbroja, i pomoćna varijabla-„brojač“, koja uzima vrijednosti od 1 do ).

Aproksimacijom eksperimentalnih tačaka različitim funkcijama dobićemo različite vrijednosti , a očito je da je ta funkcija tačnija tamo gdje je ovaj zbir manji.

Takav metod postoji i zove se metoda najmanjeg modula. Međutim, u praksi je postao mnogo rašireniji. metoda najmanjeg kvadrata, u kojem se moguće negativne vrijednosti eliminiraju ne modulom, već kvadriranjem odstupanja:

, nakon čega se napori usmjeravaju na izbor takve funkcije da je zbir kvadrata odstupanja bio što manji. Zapravo, otuda i naziv metode.

A sada se vraćamo na još jednu važnu točku: kao što je gore navedeno, odabrana funkcija bi trebala biti prilično jednostavna - ali postoji i mnogo takvih funkcija: linearno , hiperbolično, eksponencijalna, logaritamski, kvadratni itd. I, naravno, ovdje bih odmah želio "smanjiti polje aktivnosti". Koju klasu funkcija odabrati za istraživanje? Primitivna, ali efikasna tehnika:

- Najlakši način za izvlačenje bodova na crtežu i analizirati njihovu lokaciju. Ako imaju tendenciju da budu u pravoj liniji, onda biste trebali potražiti jednačina prave linije sa optimalnim vrijednostima i . Drugim riječima, zadatak je pronaći TAKVE koeficijente - tako da zbir kvadrata odstupanja bude najmanji.

Ako se tačke nalaze, na primjer, uzduž hiperbola, onda je jasno da će linearna funkcija dati lošu aproksimaciju. U ovom slučaju tražimo najpovoljnije koeficijente za jednadžbu hiperbole - oni koji daju minimalni zbir kvadrata .

Sada primijetite da u oba slučaja govorimo funkcije dvije varijable, čiji su argumenti tražili opcije zavisnosti:

A u suštini, treba da rešimo standardni problem - da pronađemo minimum funkcije dvije varijable.

Prisjetite se našeg primjera: pretpostavimo da se tačke "prodavnice" obično nalaze u pravoj liniji i da postoji svaki razlog vjerovati u prisutnost linearna zavisnost promet iz oblasti trgovanja. Nađimo TAKVE koeficijente "a" i "be" tako da zbir kvadrata odstupanja bio najmanji. Sve kao i obično - prvo parcijalni derivati ​​1. reda. Prema pravilo linearnosti možete razlikovati odmah ispod ikone sume:

Ako želite ove informacije koristiti za esej ili seminarski rad, bit ću vam jako zahvalan na linku na listi izvora, tako detaljne proračune nećete naći nigdje:

Napravimo standardni sistem:

Svaku jednačinu smanjujemo za "dvojku" i, pored toga, "razbijamo" zbrojeve:

Bilješka : nezavisno analizirati zašto se "a" i "be" mogu izvući iz ikone zbira. Inače, formalno se to može učiniti sa sumom

Prepišimo sistem u "primijenjenom" obliku:

nakon čega se počinje crtati algoritam za rješavanje našeg problema:

Znamo li koordinate tačaka? Mi znamo. Sume možemo li naći? Lako. Sastavljamo najjednostavnije sistem dvije linearne jednadžbe sa dvije nepoznate("a" i "beh"). Rešavamo sistem, npr. Cramerova metoda, što rezultira stacionarnom točkom . Provjeravam dovoljan uslov za ekstrem, možemo potvrditi da je u ovom trenutku funkcija dopire precizno minimum. Provjera je povezana s dodatnim proračunima i stoga ćemo je ostaviti iza scene. (ako je potrebno, okvir koji nedostaje može se vidjeti). Izvlačimo konačan zaključak:

Funkcija najbolji način (barem u usporedbi s bilo kojom drugom linearnom funkcijom) približava eksperimentalne tačke . Grubo govoreći, njegov graf prolazi što je moguće bliže ovim tačkama. U tradiciji ekonometrija rezultirajuća aproksimirajuća funkcija se također poziva uparena jednačina linearne regresije .

Problem koji se razmatra je od velike praktične važnosti. U situaciji sa našim primjerom, jednadžba omogućava vam da predvidite kakav promet ("yig")će biti u trgovini s jednom ili drugom vrijednošću prodajnog područja (jedno ili drugo značenje "x"). Da, rezultirajuća prognoza će biti samo prognoza, ali će se u mnogim slučajevima pokazati prilično tačnom.

Analiziraću samo jedan problem sa "pravim" brojevima, pošto u tome nema poteškoća - svi proračuni su na nivou školskog programa u 7-8 razredima. U 95 posto slučajeva od vas će se tražiti da pronađete samo linearnu funkciju, ali na samom kraju članka pokazaću da nije teže pronaći jednadžbe za optimalnu hiperbolu, eksponent i neke druge funkcije.

U stvari, ostaje distribuirati obećane dobrote - tako da naučite kako riješiti takve primjere ne samo precizno, već i brzo. Pažljivo proučavamo standard:

Zadatak

Kao rezultat proučavanja odnosa između dva indikatora, dobijeni su sljedeći parovi brojeva:

Koristeći metodu najmanjih kvadrata, pronađite linearnu funkciju koja najbolje aproksimira empirijsku (iskusan) podaci. Napravite crtež na kojem, u kartezijanskom pravokutnom koordinatnom sistemu, nacrtajte eksperimentalne točke i graf aproksimirajuće funkcije . Pronađite zbroj kvadrata odstupanja između empirijskih i teorijskih vrijednosti. Saznajte je li funkcija bolja (u smislu metode najmanjih kvadrata) približne eksperimentalne tačke.

Imajte na umu da su vrijednosti "x" prirodne vrijednosti, a to ima karakteristično smisleno značenje, o čemu ću govoriti malo kasnije; ali one, naravno, mogu biti razlomke. Osim toga, ovisno o sadržaju određenog zadatka, i "X" i "G" vrijednosti mogu biti potpuno ili djelomično negativne. Pa, dobili smo „bezličan“ zadatak i počinjemo ga rješenje:

Nalazimo koeficijente optimalne funkcije kao rješenje sistema:

Za potrebe kompaktnijeg zapisivanja, varijabla "counter" se može izostaviti, jer je već jasno da se zbrajanje vrši od 1 do .

Pogodnije je izračunati potrebne količine u tabelarnom obliku:


Izračuni se mogu izvršiti na mikrokalkulatoru, ali je mnogo bolje koristiti Excel - i brže i bez grešaka; pogledajte kratak video:

Tako dobijamo sledeće sistem:

Ovdje možete pomnožiti drugu jednačinu sa 3 i oduzmi 2. od 1. jednačine član po član. Ali to je sreća - u praksi sistemi često nisu nadareni i u takvim slučajevima štedi Cramerova metoda:
, tako da sistem ima jedinstveno rješenje.

Hajde da proverimo. Razumijem da ne želim, ali zašto preskakati greške tamo gdje ih nikako ne možete propustiti? Zamijenite pronađeno rješenje u lijevu stranu svake jednačine sistema:

Dobijaju se pravi dijelovi odgovarajućih jednačina, što znači da je sistem ispravno riješen.

Dakle, željena aproksimirajuća funkcija: – od sve linearne funkcije eksperimentalni podaci se najbolje aproksimiraju.

Za razliku od ravno zavisnost prometa prodavnice od njene površine, pronađena zavisnost je obrnuto (princip "što više - manje"), a tu činjenicu odmah otkriva negativac ugaoni koeficijent. Funkcija obavještava nas da se povećanjem određenog pokazatelja za 1 jedinicu smanjuje vrijednost zavisnog indikatora prosjek za 0,65 jedinica. Kako kažu, što je viša cijena heljde, to se manje prodaje.

Da bismo nacrtali aproksimirajuću funkciju, nalazimo dvije njene vrijednosti:

i izvedite crtež:


Konstruirana linija se zove linija trenda (naime, linearna linija trenda, tj. u opštem slučaju, trend nije nužno ravna linija). Svima je poznat izraz "biti u trendu", a mislim da ovaj izraz ne treba dodatno komentarisati.

Izračunajte zbir kvadrata odstupanja između empirijskih i teorijskih vrijednosti. Geometrijski, ovo je zbir kvadrata dužina "grimiznih" segmenata (od kojih su dva tako mala da ih ne možete ni vidjeti).

Sumiramo proračune u tabeli:


Opet se mogu izvesti ručno, za svaki slučaj daću primjer za 1. točku:

ali mnogo je efikasnije uraditi već poznati način:

da ponovimo: šta je smisao rezultata? Od sve linearne funkcije funkcija eksponent je najmanji, odnosno najbolja je aproksimacija u svojoj porodici. I ovdje, usput, konačno pitanje problema nije slučajno: šta ako je predložena eksponencijalna funkcija da li će biti bolje aproksimirati eksperimentalne tačke?

Nađimo odgovarajući zbir kvadrata odstupanja - da ih razlikujemo, označit ću ih slovom "epsilon". Tehnika je potpuno ista:


I opet za svaki proračun požara za 1. tačku:

U Excelu koristimo standardnu ​​funkciju EXP (Sintaksa se može naći u Excel pomoći).

Zaključak: , pa eksponencijalna funkcija aproksimira eksperimentalne tačke lošije od prave linije .

Ali ovdje treba napomenuti da je "gore". ne znači još, šta nije uredu. Sada sam napravio graf ove eksponencijalne funkcije - i ona takođe prolazi blizu tačaka - toliko da je bez analitičke studije teško reći koja je funkcija tačnija.

Time je rješenje završeno i vraćam se na pitanje prirodnih vrijednosti argumenta. U raznim studijama, po pravilu, ekonomskim ili sociološkim, mjeseci, godine ili drugi jednaki vremenski intervali se numerišu prirodnim "X". Razmotrite, na primjer, takav problem.

Primjer.

Eksperimentalni podaci o vrijednostima varijabli X I at date su u tabeli.

Kao rezultat njihovog usklađivanja, funkcija

Koristeći metoda najmanjeg kvadrata, aproksimira ove podatke linearnom zavisnošću y=ax+b(pronaći parametre A I b). Saznajte koja od dvije linije je bolja (u smislu metode najmanjih kvadrata) poravnava eksperimentalne podatke. Napravite crtež.

Suština metode najmanjih kvadrata (LSM).

Problem je pronaći koeficijente linearne zavisnosti za koje je funkcija dvije varijable A I b uzima najmanju vrijednost. Odnosno, s obzirom na podatke A I b zbir kvadrata odstupanja eksperimentalnih podataka od pronađene prave će biti najmanji. Ovo je cijela poenta metode najmanjih kvadrata.

Dakle, rješenje primjera se svodi na pronalaženje ekstrema funkcije dvije varijable.

Izvođenje formula za pronalaženje koeficijenata.

Sastavlja se i rješava sistem dvije jednačine sa dvije nepoznate. Pronalaženje parcijalnih izvoda funkcija po varijablama A I b, izjednačavamo ove izvode sa nulom.

Rezultirajući sistem jednačina rješavamo bilo kojom metodom (npr metoda zamjene ili Cramerova metoda) i dobiti formule za pronalaženje koeficijenata metodom najmanjih kvadrata (LSM).

Sa podacima A I b funkcija uzima najmanju vrijednost. Dokaz ove činjenice je dat ispod teksta na kraju stranice.

To je cijela metoda najmanjih kvadrata. Formula za pronalaženje parametra a sadrži sume ,,, i parametar n- količina eksperimentalnih podataka. Vrijednosti ovih suma se preporučuje da se izračunaju zasebno. Koeficijent b pronađeno nakon izračuna a.

Vrijeme je da se prisjetimo originalnog primjera.

Rješenje.

U našem primjeru n=5. Popunjavamo tablicu radi praktičnosti izračunavanja iznosa koji su uključeni u formule potrebnih koeficijenata.

Vrijednosti u četvrtom redu tabele dobijaju se množenjem vrijednosti 2. retka sa vrijednostima 3. reda za svaki broj i.

Vrijednosti u petom redu tabele dobijaju se kvadriranjem vrijednosti 2. reda za svaki broj i.

Vrijednosti posljednje kolone tabele su zbroji vrijednosti u redovima.

Za pronalaženje koeficijenata koristimo formule metode najmanjih kvadrata A I b. U njih zamjenjujemo odgovarajuće vrijednosti iz posljednje kolone tabele:

dakle, y=0,165x+2,184 je željena aproksimirajuća ravna linija.

Ostaje da saznamo koja od linija y=0,165x+2,184 ili bolje aproksimira originalne podatke, tj. da procjenu metodom najmanjih kvadrata.

Procjena greške metode najmanjih kvadrata.

Da biste to učinili, morate izračunati sume kvadrata odstupanja originalnih podataka od ovih linija I , manja vrijednost odgovara liniji koja bolje aproksimira originalne podatke u smislu metode najmanjih kvadrata.

Od , onda linija y=0,165x+2,184 bolje aproksimira originalne podatke.

Grafička ilustracija metode najmanjih kvadrata (LSM).

Sve izgleda odlično na grafikonima. Crvena linija je pronađena linija y=0,165x+2,184, plava linija je , ružičaste tačke su originalni podaci.

U praksi, prilikom modeliranja različitih procesa - posebno ekonomskih, fizičkih, tehničkih, društvenih - široko se koristi jedna ili ona metoda izračunavanja približnih vrijednosti funkcija iz njihovih poznatih vrijednosti u nekim fiksnim točkama.

Često se javljaju problemi aproksimacije funkcija ove vrste:

    prilikom konstruiranja približnih formula za izračunavanje vrijednosti karakterističnih veličina procesa koji se proučava prema tabličnim podacima dobivenim kao rezultat eksperimenta;

    u numeričkoj integraciji, diferencijaciji, rješavanju diferencijalnih jednadžbi, itd.;

    ako je potrebno izračunati vrijednosti funkcija u srednjim točkama razmatranog intervala;

    pri određivanju vrijednosti karakterističnih veličina procesa izvan intervala koji se razmatra, posebno prilikom predviđanja.

Ako se, da bi se modelirao određeni proces specificiran u tabeli, konstruiše funkcija koja približno opisuje ovaj proces na osnovu metode najmanjih kvadrata, ona će se zvati aproksimirajuća funkcija (regresija), a sam zadatak konstruisanja aproksimirajućih funkcija će biti problem aproksimacije.

U ovom članku se razmatraju mogućnosti MS Excel paketa za rješavanje ovakvih problema, a date su i metode i tehnike za konstruiranje (kreiranje) regresija za tabelarni zadane funkcije (koje su osnova regresione analize).

Postoje dvije opcije za pravljenje regresija u Excelu.

    Dodavanje odabranih regresija (linija trenda) na grafikon izgrađen na osnovu tabele podataka za proučavanu karakteristiku procesa (dostupno samo ako je grafikon izgrađen);

    Korištenje ugrađenih statističkih funkcija Excel radnog lista, koje vam omogućavaju da dobijete regresije (linije trenda) direktno iz izvorne tablice podataka.

Dodavanje linija trenda grafikonu

Za tabelu podataka koja opisuje određeni proces i predstavlja dijagram, Excel ima efikasan alat za analizu regresije koji vam omogućava:

    izgraditi na osnovu metode najmanjih kvadrata i dodati dijagramu pet tipova regresija koje modeliraju proces koji se proučava sa različitim stepenom tačnosti;

    dodati jednačinu konstruisane regresije dijagramu;

    odrediti stepen usklađenosti odabrane regresije sa podacima prikazanim na grafikonu.

Na osnovu podataka grafikona, Excel vam omogućava da dobijete linearne, polinomske, logaritamske, eksponencijalne, eksponencijalne tipove regresije, koje su date jednadžbom:

y = y(x)

gdje je x nezavisna varijabla, koja često uzima vrijednosti niza prirodnih brojeva (1; 2; 3; ...) i proizvodi, na primjer, odbrojavanje vremena procesa koji se proučava (karakteristike) .

1 . Linearna regresija je dobra u modeliranju karakteristika koje se povećavaju ili smanjuju konstantnom brzinom. Ovo je najjednostavniji model procesa koji se proučava. Gradi se prema jednadžbi:

y=mx+b

gdje je m tangenta nagiba linearne regresije prema x-osi; b - koordinata tačke preseka linearne regresije sa y-osom.

2 . Polinomska linija trenda korisna je za opisivanje karakteristika koje imaju nekoliko različitih ekstrema (visoke i niske). Izbor stepena polinoma određen je brojem ekstrema ispitivane karakteristike. Dakle, polinom drugog stepena može dobro opisati proces koji ima samo jedan maksimum ili minimum; polinom trećeg stepena - ne više od dva ekstrema; polinom četvrtog stepena - ne više od tri ekstrema, itd.

U ovom slučaju, linija trenda se gradi u skladu sa jednadžbom:

y = c0 + c1x + c2x2 + c3x3 + c4x4 + c5x5 + c6x6

gdje su koeficijenti c0, c1, c2,...c6 konstante čije se vrijednosti određuju tokom izgradnje.

3 . Logaritamska linija trenda uspješno se koristi u modeliranju karakteristika, čije se vrijednosti u početku brzo mijenjaju, a zatim se postupno stabiliziraju.

y = c ln(x) + b

4 . Linija trenda snage daje dobre rezultate ako se vrijednosti proučavane ovisnosti karakteriziraju konstantnom promjenom stope rasta. Primjer takve ovisnosti može poslužiti kao graf ravnomjerno ubrzanog kretanja automobila. Ako u podacima postoje nula ili negativne vrijednosti, ne možete koristiti liniju trenda snage.

Gradi se u skladu sa jednačinom:

y = cxb

gdje su koeficijenti b, c konstante.

5 . Eksponencijalnu liniju trenda treba koristiti ako se stopa promjene podataka kontinuirano povećava. Za podatke koji sadrže nulte ili negativne vrijednosti, ova vrsta aproksimacije također nije primjenjiva.

Gradi se u skladu sa jednačinom:

y=cebx

gdje su koeficijenti b, c konstante.

Prilikom odabira linije trenda, Excel automatski izračunava vrijednost R2, koja karakterizira tačnost aproksimacije: što je vrijednost R2 bliža jedinici, to pouzdanije linija trenda aproksimira proces koji se proučava. Ako je potrebno, vrijednost R2 se uvijek može prikazati na dijagramu.

Određeno formulom:

Da dodate liniju trenda seriji podataka:

    aktivirajte grafikon izgrađen na osnovu niza podataka, odnosno kliknite unutar područja grafikona. Stavka grafikona će se pojaviti u glavnom meniju;

    nakon klika na ovu stavku, na ekranu će se pojaviti meni u kojem treba izabrati komandu Dodaj liniju trenda.

Iste radnje se lako implementiraju ako zadržite pokazivač miša iznad grafikona koji odgovara jednoj od serija podataka i kliknete desnim tasterom miša; u kontekstnom meniju koji se pojavi izaberite komandu Dodaj liniju trenda. Dijalog Trendline će se pojaviti na ekranu sa otvorenom karticom Type (Slika 1).

Nakon toga trebate:

Na kartici Tip odaberite potrebnu vrstu linije trenda (Linear je odabran prema zadanim postavkama). Za tip polinoma, u polju Stepen navedite stepen izabranog polinoma.

1 . Polje Izgrađene serije navodi sve serije podataka u dotičnom grafikonu. Da biste dodali liniju trenda određenoj seriji podataka, odaberite njeno ime u polju Izgrađena serija.

Ako je potrebno, odlaskom na karticu Parameters (Slika 2), možete podesiti sljedeće parametre za liniju trenda:

    promijenite naziv linije trenda u polju Naziv aproksimativne (izglađene) krive.

    podesite broj perioda (unaprijed ili unazad) za prognozu u polju Prognoza;

    prikazati jednadžbu linije trenda u oblasti grafikona, za koju treba da omogućite checkbox za prikaz jednačine na grafikonu;

    prikažite vrijednost pouzdanosti aproksimacije R2 u području dijagrama, za šta treba da omogućite potvrdni okvir da vrijednost pouzdanosti aproksimacije (R^2) postavite na dijagram;

    postavite tačku preseka linije trenda sa Y-osom, za koju treba da omogućite checkbox Presek krive sa Y-osom u tački;

    kliknite na dugme OK da zatvorite dijaloški okvir.

Postoje tri načina da počnete uređivati ​​već izgrađenu liniju trenda:

    koristite komandu Odabrana linija trenda iz menija Format, nakon odabira linije trenda;

    izaberite komandu Format Trendline iz kontekstnog menija, koja se poziva desnim klikom na liniju trenda;

    dvostrukim klikom na liniju trenda.

Na ekranu će se pojaviti dijaloški okvir Format Trendline (Slika 3), koji sadrži tri kartice: Pogled, Tip, Parametri, a sadržaj posljednje dvije potpuno se poklapa sa sličnim karticama Trendline dijaloškog okvira (Sl. 1-2 ). Na kartici Prikaz možete postaviti vrstu linije, njenu boju i debljinu.

Da biste izbrisali već izgrađenu liniju trenda, odaberite liniju trenda koju želite izbrisati i pritisnite tipku Delete.

Prednosti razmatranog alata regresione analize su:

    relativna lakoća iscrtavanja linije trenda na grafikonima bez kreiranja tabele podataka za to;

    prilično široka lista tipova predloženih linija trenda, a ova lista uključuje najčešće korištene vrste regresije;

    mogućnost predviđanja ponašanja procesa koji se proučava za proizvoljan (u okviru zdravog razuma) broj koraka naprijed, kao i nazad;

    mogućnost dobijanja jednačine linije trenda u analitičkom obliku;

    mogućnost, ako je potrebno, dobijanja procjene pouzdanosti aproksimacije.

Nedostaci uključuju sljedeće tačke:

    izgradnja linije trenda se izvodi samo ako postoji grafikon izgrađen na nizu podataka;

    proces generiranja niza podataka za karakteristiku koja se proučava na temelju jednadžbi linije trenda dobivenih za nju je donekle pretrpan: željene regresijske jednadžbe se ažuriraju sa svakom promjenom vrijednosti izvorne serije podataka, ali samo unutar područja grafikona , dok serija podataka formirana na osnovu trenda stare jednačine linije ostaje nepromijenjena;

    U izveštajima zaokretnog grafikona, kada promenite prikaz grafikona ili povezani izveštaj zaokretne tabele, postojeće linije trenda se ne čuvaju, što znači da pre nego što nacrtate linije trenda ili na drugi način formatirate izveštaj zaokretnog grafikona, morate osigurati da izgled izveštaja ispunjava vaše zahteve.

Linije trenda se mogu dodati serijama podataka predstavljenih na grafikonima kao što su grafikoni, histogrami, ravni grafikoni nenormaliziranih površina, trakasti, razbacani, balončići i grafikoni dionica.

Ne možete dodati linije trenda serijama podataka na 3-D, standardnim, radarskim, tortnim i krofnim grafikonima.

Korištenje ugrađenih Excel funkcija

Excel takođe pruža alat za regresijsku analizu za crtanje linija trenda izvan područja grafikona. Brojne statističke funkcije radnog lista mogu se koristiti za ovu svrhu, ali sve vam omogućavaju da izgradite samo linearne ili eksponencijalne regresije.

Excel ima nekoliko funkcija za izgradnju linearne regresije, posebno:

    TREND;

  • KOSINA i REZ.

Kao i nekoliko funkcija za konstruiranje eksponencijalne linije trenda, posebno:

    LGRFPapprox.

Treba napomenuti da su tehnike za konstruisanje regresije korišćenjem funkcija TREND i RAST praktično iste. Isto se može reći i za par funkcija LINEST i LGRFPRIBL. Za ove četiri funkcije, prilikom kreiranja tablice vrijednosti, koriste se Excel funkcije kao što su formule niza, što donekle otežava proces izgradnje regresija. Također napominjemo da je konstrukciju linearne regresije, po našem mišljenju, najlakše implementirati korištenjem funkcija SLOPE i INTERCEPT, gdje prva određuje nagib linearne regresije, a druga određuje segment odsječen regresijom na y-osi.

Prednosti ugrađenog funkcijskog alata za regresionu analizu su:

    prilično jednostavan proces istog tipa formiranja nizova podataka ispitivane karakteristike za sve ugrađene statističke funkcije koje postavljaju linije trenda;

    standardna tehnika za konstruisanje linija trenda na osnovu generisanih serija podataka;

    sposobnost predviđanja ponašanja procesa koji se proučava za potreban broj koraka naprijed ili nazad.

A nedostaci uključuju činjenicu da Excel nema ugrađene funkcije za kreiranje drugih (osim linearnih i eksponencijalnih) tipova linija trenda. Ova okolnost često ne dozvoljava odabir dovoljno preciznog modela procesa koji se proučava, kao i dobijanje prognoza bliskih stvarnosti. Osim toga, kada se koriste funkcije TREND i GROW, jednadžbe linija trenda nisu poznate.

Treba napomenuti da autori nisu za cilj postavili da predstavi tok regresione analize sa različitim stepenom potpunosti. Njegov glavni zadatak je da na konkretnim primjerima pokaže mogućnosti Excel paketa u rješavanju aproksimacijskih problema; demonstrirati koje efikasne alate Excel ima za pravljenje regresija i predviđanja; ilustruju kako relativno lako takve probleme može riješiti čak i korisnik koji nema duboko znanje o regresijskoj analizi.

Primjeri rješavanja konkretnih problema

Razmotrite rješavanje konkretnih problema pomoću navedenih alata Excel paketa.

Zadatak 1

Sa tabelom podataka o dobiti autotransportnog preduzeća za 1995-2002. potrebno je da uradite sledeće.

    Napravite grafikon.

    Dodajte linearne i polinomske (kvadratne i kubične) linije trenda na grafikon.

    Koristeći jednačine linije trenda, dobiti tabelarne podatke o dobiti preduzeća za svaku liniju trenda za 1995-2004.

    Napravite prognozu dobiti za preduzeće za 2003. i 2004. godinu.

Rješenje problema

    U opseg ćelija A4:C11 Excel radnog lista unosimo radni list prikazan na sl. 4.

    Nakon odabira raspona ćelija B4:C11, gradimo grafikon.

    Aktiviramo izgrađeni grafikon i, koristeći gore opisanu metodu, nakon odabira tipa linije trenda u dijaloškom okviru Trend Linija (vidi sliku 1), naizmenično dodajemo linearne, kvadratne i kubične linije trenda na grafikon. U istom dijaloškom okviru otvorite karticu Parametri (vidi sliku 2), u polje Naziv aproksimirajuće (izglađene) krive unesite naziv trenda koji se dodaje, au polje Prognoza naprijed za: periode postavite vrijednost 2, budući da je planirana prognoza dobiti za dvije godine unaprijed. Za prikaz jednačine regresije i vrijednosti pouzdanosti aproksimacije R2 u području dijagrama, omogućite potvrdne okvire Prikaži jednačinu na ekranu i postavite vrijednost pouzdanosti aproksimacije (R^2) na dijagram. Za bolju vizuelnu percepciju menjamo vrstu, boju i debljinu iscrtanih linija trenda, za šta koristimo karticu View u dijalogu Format linije trenda (vidi sliku 3). Rezultirajući grafikon sa dodanim linijama trenda prikazan je na sl. 5.

    Dobiti tabelarne podatke o dobiti preduzeća za svaku liniju trenda za 1995-2004. Koristimo jednadžbe linija trenda prikazane na sl. 5. Da biste to učinili, u ćelije raspona D3:F3 unesite tekstualne informacije o tipu odabrane linije trenda: Linearni trend, Kvadratični trend, Kubni trend. Zatim unesite formulu linearne regresije u ćeliju D4 i, koristeći marker za popunjavanje, kopirajte ovu formulu s relativnim referencama na raspon ćelija D5:D13. Treba napomenuti da svaka ćelija sa formulom linearne regresije iz opsega ćelija D4:D13 ima odgovarajuću ćeliju iz opsega A4:A13 kao argument. Slično, za kvadratnu regresiju popunjava se raspon ćelija E4:E13, a za kubičnu regresiju popunjava se raspon ćelija F4:F13. Tako je napravljena prognoza dobiti preduzeća za 2003. i 2004. godinu. sa tri trenda. Rezultirajuća tabela vrijednosti prikazana je na sl. 6.

Zadatak 2

    Napravite grafikon.

    Dodajte logaritamske, eksponencijalne i eksponencijalne linije trenda na grafikon.

    Izvesti jednadžbe dobijenih linija trenda, kao i vrijednosti pouzdanosti aproksimacije R2 za svaku od njih.

    Koristeći jednačine linije trenda, dobiti tabelarne podatke o dobiti preduzeća za svaku liniju trenda za 1995-2002.

    Napravite prognozu profita za poslovanje za 2003. i 2004. koristeći ove trendove.

Rješenje problema

Prateći metodologiju datu u rješavanju problema 1, dobijamo dijagram sa dodanim logaritamskim, eksponencijalnim i eksponencijalnim linijama trenda (slika 7). Dalje, koristeći dobijene jednadžbe linije trenda, popunjavamo tabelu vrijednosti za dobit preduzeća, uključujući i predviđene vrijednosti za 2003. i 2004. godinu. (Sl. 8).

Na sl. 5 i sl. može se vidjeti da model sa logaritamskim trendom odgovara najnižoj vrijednosti pouzdanosti aproksimacije

R2 = 0,8659

Najveće vrijednosti R2 odgovaraju modelima sa polinomskim trendom: kvadratni (R2 = 0,9263) i kubični (R2 = 0,933).

Zadatak 3

Sa tabelom podataka o dobiti autotransportnog preduzeća za 1995-2002, datom u zadatku 1, morate izvršiti sljedeće korake.

    Dobijte serije podataka za linearne i eksponencijalne linije trenda koristeći funkcije TREND i GROW.

    Koristeći funkcije TREND i RAST, napravite prognozu profita za preduzeće za 2003. i 2004. godinu.

    Za početne podatke i primljene serije podataka konstruirajte dijagram.

Rješenje problema

Koristimo radni list zadatka 1 (vidi sliku 4). Počnimo s funkcijom TREND:

    odaberite raspon ćelija D4:D11, koje treba popuniti vrijednostima funkcije TREND koje odgovaraju poznatim podacima o dobiti poduzeća;

    pozovite komandu Funkcija iz menija Insert. U dijalogu Čarobnjak za funkcije koji se pojavi, izaberite funkciju TREND iz kategorije Statistike, a zatim kliknite na dugme U redu. Ista operacija se može izvesti pritiskom na tipku (funkcija umetanja) na standardnoj alatnoj traci.

    U dijaloškom okviru Argumenti funkcije koji se pojavi unesite opseg ćelija C4:C11 u polje Poznate_vrijednosti_y; u polju Poznate_vrijednosti_x - opseg ćelija B4:B11;

    da unesenu formulu pretvorite u formulu niza, koristite kombinaciju tipki + + .

Formula koju smo uneli u traku sa formulama će izgledati ovako: =(TREND(C4:C11;B4:B11)).

Kao rezultat toga, raspon ćelija D4:D11 je ispunjen odgovarajućim vrijednostima funkcije TREND (slika 9).

Da se napravi prognoza dobiti kompanije za 2003. i 2004. godinu. potrebno:

    odaberite raspon ćelija D12:D13, gdje će biti unesene vrijednosti predviđene funkcijom TREND.

    pozovite funkciju TREND i u dijaloškom okviru Argumenti funkcije koji se pojavi unesite u polje Poznate_vrijednosti_y - opseg ćelija C4:C11; u polju Poznate_vrijednosti_x - opseg ćelija B4:B11; a u polju Nove_vrijednosti_x - opseg ćelija B12:B13.

    pretvorite ovu formulu u formulu niza koristeći prečicu na tastaturi Ctrl + Shift + Enter.

    Unesena formula će izgledati ovako: =(TREND(C4:C11;B4:B11;B12:B13)), a opseg ćelija D12:D13 će biti popunjen predviđenim vrijednostima funkcije TREND (vidi Sl. 9).

Slično, niz podataka se popunjava pomoću funkcije GROWTH, koja se koristi u analizi nelinearnih zavisnosti i radi potpuno isto kao i njen linearni pandan TREND.

Slika 10 prikazuje tabelu u načinu prikaza formule.

Za početne podatke i dobijene serije podataka, dijagram prikazan na sl. jedanaest.

Zadatak 4

Sa tabelom podataka o prijemu zahtjeva za usluge od strane dispečerske službe autotransportnog preduzeća za period od 1. do 11. dana u tekućem mjesecu, potrebno je izvršiti sljedeće radnje.

    Dobiti niz podataka za linearnu regresiju: ​​korištenjem funkcija SLOPE i INTERCEPT; koristeći funkciju LINEST.

    Dohvatite niz podataka za eksponencijalnu regresiju koristeći funkciju LYFFPRIB.

    Koristeći gore navedene funkcije, napravite prognozu prijema prijava u dispečersku službu za period od 12. do 14. dana u tekućem mjesecu.

    Za originalne i primljene serije podataka konstruirajte dijagram.

Rješenje problema

Imajte na umu da, za razliku od funkcija TREND i GROW, nijedna od gore navedenih funkcija (SLOPE, INTERCEPTION, LINEST, LGRFPRIB) nije regresija. Ove funkcije igraju samo pomoćnu ulogu, određujući potrebne parametre regresije.

Za linearne i eksponencijalne regresije izgrađene korištenjem funkcija SLOPE, INTERCEPT, LINEST, LGRFINB, izgled njihovih jednačina je uvijek poznat, za razliku od linearnih i eksponencijalnih regresija koje odgovaraju funkcijama TREND i GROWTH.

1 . Napravimo linearnu regresiju koja ima jednačinu:

y=mx+b

koristeći funkcije SLOPE i INTERCEPT, pri čemu je nagib regresije m određen funkcijom SLOPE, a konstantni član b - funkcijom INTERCEPT.

Da bismo to učinili, izvodimo sljedeće radnje:

    unesite izvornu tabelu u opseg ćelija A4:B14;

    vrijednost parametra m će biti određena u ćeliji C19. Izaberite iz kategorije Statistike funkciju nagiba; unesite opseg ćelija B4:B14 u polje poznate_vrijednosti_y i raspon ćelija A4:A14 u polje poznate_vrijednosti_x. Formula će biti uneta u ćeliju C19: =SLOPE(B4:B14;A4:A14);

    pomoću slične metode određuje se vrijednost parametra b u ćeliji D19. A njegov sadržaj će izgledati ovako: = INTERCEPT(B4:B14;A4:A14). Dakle, vrijednosti parametara m i b, neophodnih za konstruiranje linearne regresije, bit će pohranjene, respektivno, u ćelijama C19, D19;

    tada unosimo formulu linearne regresije u ćeliju C4 u obliku: = $ C * A4 + $ D. U ovoj formuli ćelije C19 i D19 su napisane sa apsolutnim referencama (adresa ćelije ne bi trebalo da se menja sa mogućim kopiranjem). Apsolutni referentni znak $ može se otkucati ili sa tastature ili pomoću tastera F4, nakon postavljanja kursora na adresu ćelije. Koristeći ručicu za popunjavanje, kopirajte ovu formulu u raspon ćelija C4:C17. Dobijamo željenu seriju podataka (slika 12). Zbog činjenice da je broj zahtjeva cijeli broj, trebate postaviti format broja na kartici Broj prozora Format ćelije sa brojem decimalnih mjesta na 0.

2 . Sada napravimo linearnu regresiju datu jednadžbom:

y=mx+b

koristeći funkciju LINEST.

Za ovo:

    unesite funkciju LINEST kao formulu niza u raspon ćelija C20:D20: =(LINEST(B4:B14;A4:A14)). Kao rezultat, dobijamo vrijednost parametra m u ćeliji C20, a vrijednost parametra b u ćeliji D20;

    unesite formulu u ćeliju D4: =$C*A4+$D;

    kopirajte ovu formulu koristeći marker za popunjavanje u raspon ćelija D4:D17 i dobijete željenu seriju podataka.

3 . Gradimo eksponencijalnu regresiju koja ima jednačinu:

uz pomoć funkcije LGRFPRIBL se izvodi slično:

    u rasponu ćelija C21:D21 unesite funkciju LRGRFPRIBL kao formulu niza: =( LGRFPRIBL (B4:B14;A4:A14)). U ovom slučaju, vrijednost parametra m će biti određena u ćeliji C21, a vrijednost parametra b će biti određena u ćeliji D21;

    formula se unosi u ćeliju E4: =$D*$C^A4;

    korišćenjem markera za popunjavanje, ova formula se kopira u opseg ćelija E4:E17, gde će se nalaziti serija podataka za eksponencijalnu regresiju (vidi sliku 12).

Na sl. 13 prikazuje tabelu u kojoj možemo vidjeti funkcije koje koristimo s potrebnim opsezima ćelija, kao i formule.

Vrijednost R 2 pozvao koeficijent determinacije.

Zadatak konstruisanja regresijske zavisnosti je da se pronađe vektor koeficijenata m modela (1) na kome koeficijent R poprima maksimalnu vrednost.

Da bi se procijenila značajnost R, koristi se Fisherov F-test, izračunat po formuli

Gdje n- veličina uzorka (broj eksperimenata);

k je broj koeficijenata modela.

Ako F premašuje neku kritičnu vrijednost za podatke n I k i prihvaćeni nivo pouzdanosti, onda se vrijednost R smatra značajnom. Tabele kritičnih vrijednosti F date su u priručniku o matematičkoj statistici.

Dakle, značaj R ne određuje samo njegova vrijednost, već i odnos između broja eksperimenata i broja koeficijenata (parametara) modela. Zaista, omjer korelacije za n=2 za jednostavan linearni model je 1 (kroz 2 tačke na ravni, uvijek možete nacrtati jednu pravu liniju). Međutim, ako su eksperimentalni podaci slučajne varijable, takvoj vrijednosti R treba vjerovati s velikom pažnjom. Obično, da bi se dobila značajna R i pouzdana regresija, cilj je osigurati da broj eksperimenata značajno premašuje broj koeficijenata modela (n>k).

Da biste izgradili model linearne regresije, morate:

1) pripremiti listu od n redaka i m stupaca koji sadrže eksperimentalne podatke (kolona koja sadrži izlaznu vrijednost Y mora biti prvi ili zadnji na listi); na primjer, uzmimo podatke prethodnog zadatka, dodajući kolonu pod nazivom "broj perioda", numerirajući brojeve perioda od 1 do 12. (ovo će biti vrijednosti X)

2) idite na meni Podaci/Analiza podataka/Regresija

Ako nedostaje stavka "Analiza podataka" u meniju "Alati", onda treba da odete na stavku "Dodaci" istog menija i označite polje "Paket analize".

3) u dijaloškom okviru "Regresija" postavite:

ulazni interval Y;

ulazni interval X;

izlazni interval - gornja lijeva ćelija intervala u koji će biti smješteni rezultati proračuna (preporučljivo je postaviti na novi radni list);

4) kliknite na "OK" i analizirajte rezultate.

Ako neka fizička veličina ovisi o drugoj veličini, onda se ta ovisnost može istražiti mjerenjem y pri različitim vrijednostima x. Kao rezultat mjerenja dobija se niz vrijednosti:

x 1 , x 2 , ..., x i , ... , x n ;

y 1 , y 2 , ..., y i , ... , y n .

Na osnovu podataka takvog eksperimenta moguće je nacrtati zavisnost y = ƒ(x). Rezultirajuća kriva omogućava procjenu oblika funkcije ƒ(x). Međutim, konstantni koeficijenti koji ulaze u ovu funkciju ostaju nepoznati. Mogu se odrediti metodom najmanjih kvadrata. Eksperimentalne tačke, po pravilu, ne leže tačno na krivulji. Metoda najmanjih kvadrata zahtijeva da zbir kvadrata odstupanja eksperimentalnih tačaka od krive, tj. 2 je bio najmanji.

U praksi se ova metoda najčešće (i najjednostavnije) koristi u slučaju linearnog odnosa, tj. Kada

y=kx ili y = a + bx.

Linearna zavisnost je veoma raširena u fizici. Čak i kada je zavisnost nelinearna, oni obično pokušavaju da naprave graf na takav način da dobiju ravnu liniju. Na primjer, ako se pretpostavi da je indeks loma stakla n povezan s valnom dužinom λ svjetlosnog vala relacijom n = a + b/λ 2 , tada je ovisnost n od λ -2 ucrtana na graf .

Uzmite u obzir zavisnost y=kx(prava koja prolazi kroz ishodište). Sastavimo vrijednost φ kao zbir kvadrata odstupanja naših tačaka od prave linije

Vrijednost φ je uvijek pozitivna i ispada da je manja što su naše tačke bliže pravoj liniji. Metoda najmanjih kvadrata kaže da za k treba izabrati takvu vrijednost pri kojoj φ ima minimum


ili
(19)

Proračun pokazuje da je srednja kvadratna greška u određivanju vrijednosti k jednaka

, (20)
gdje je n broj dimenzija.

Razmotrimo sada nešto teži slučaj, kada tačke moraju zadovoljiti formulu y = a + bx(prava koja ne prolazi kroz ishodište).

Zadatak je pronaći najbolje vrijednosti a i b iz datog skupa vrijednosti x i , y i .

Ponovo sastavljamo kvadratni oblik φ jednak zbroju kvadrata odstupanja tačaka x i , y i od prave

i pronađite vrijednosti a i b za koje φ ima minimum

;

.

.

Zajedničko rješenje ovih jednačina daje

(21)

Srednje kvadratne greške određivanja a i b su jednake

(23)

.  (24)

Prilikom obrade rezultata mjerenja ovom metodom, zgodno je sve podatke sumirati u tabelu u kojoj su preliminarno izračunati svi iznosi uključeni u formule (19)(24). Obrasci ovih tabela prikazani su u primjerima ispod.

Primjer 1 Proučavana je osnovna jednadžba dinamike rotacionog kretanja ε = M/J (prava koja prolazi kroz ishodište). Za različite vrijednosti momenta M mjereno je ugaono ubrzanje ε određenog tijela. Potrebno je odrediti moment inercije ovog tijela. Rezultati mjerenja momenta sile i kutnog ubrzanja navedeni su u drugom i trećem stupcu tabele 5.

Tabela 5
n M, N m ε, s-1 M2 M ε ε - km (ε - km) 2
1 1.44 0.52 2.0736 0.7488 0.039432 0.001555
2 3.12 1.06 9.7344 3.3072 0.018768 0.000352
3 4.59 1.45 21.0681 6.6555 -0.08181 0.006693
4 5.90 1.92 34.81 11.328 -0.049 0.002401
5 7.45 2.56 55.5025 19.072 0.073725 0.005435
– – 123.1886 41.1115 – 0.016436

Formulom (19) određujemo:

.

Za određivanje korijenske srednje kvadratne greške koristimo formulu (20)

0.005775kg-1 · m -2 .

Po formuli (18) imamo

; .

SJ = (2,996 0,005775)/0,3337 = 0,05185 kg m 2.

S obzirom na pouzdanost P = 0,95, prema tabeli Studentovih koeficijenata za n = 5, nalazimo t = 2,78 i odredimo apsolutnu grešku ΔJ = 2,78 0,05185 = 0,1441 ≈ 0,2 kg m 2.

Rezultate pišemo u obliku:

J = (3,0 ± 0,2) kg m 2;


Primjer 2 Temperaturni koeficijent otpornosti metala izračunavamo metodom najmanjih kvadrata. Otpor ovisi o temperaturi prema linearnom zakonu

R t \u003d R 0 (1 + α t °) \u003d R 0 + R 0 α t °.

Slobodni član određuje otpor R 0 na temperaturi od 0 °C, a ugaoni koeficijent je proizvod temperaturnog koeficijenta α i otpora R 0 .

Rezultati mjerenja i proračuna dati su u tabeli ( vidi tabelu 6).

Tabela 6
n t°, s r, Ohm t-¯t (t-¯t) 2 (t-¯t)r r-bt-a (r - bt - a) 2,10 -6
1 23 1.242 -62.8333 3948.028 -78.039 0.007673 58.8722
2 59 1.326 -26.8333 720.0278 -35.581 -0.00353 12.4959
3 84 1.386 -1.83333 3.361111 -2.541 -0.00965 93.1506
4 96 1.417 10.16667 103.3611 14.40617 -0.01039 107.898
5 120 1.512 34.16667 1167.361 51.66 0.021141 446.932
6 133 1.520 47.16667 2224.694 71.69333 -0.00524 27.4556
515 8.403 – 8166.833 21.5985 – 746.804
∑/n 85.83333 1.4005 – – – – –

Formulama (21), (22) određujemo

R 0 = ¯ R- α R 0 ¯ t = 1,4005 - 0,002645 85,83333 = 1,1735 Ohm.

Nađimo grešku u definiciji α. Budući da , tada po formuli (18) imamo:

.

Koristeći formule (23), (24) imamo

;

0.014126 Ohm.

S obzirom na pouzdanost P = 0,95, prema tabeli Studentovih koeficijenata za n = 6, nalazimo t = 2,57 i odredimo apsolutnu grešku Δα = 2,57 0,000132 = 0,000338 stepen -1.

α = (23 ± 4) 10 -4 hail-1 na P = 0,95.


Primjer 3 Potrebno je odrediti radijus zakrivljenosti sočiva iz Newtonovih prstenova. Izmjereni su poluprečniki Njutnovih prstenova r m i određeni brojevi ovih prstenova m. Poluprečnici Njutnovih prstenova povezani su sa radijusom zakrivljenosti sočiva R i brojem prstena po jednačini

r 2 m = mλR - 2d 0 R,

gdje je d 0 debljina jaza između sočiva i ravnoparalelne ploče (ili deformacija sočiva),

λ je talasna dužina upadne svjetlosti.

λ = (600 ± 6) nm;
r 2 m = y;
m = x;
λR = b;
-2d 0 R = a,

tada će jednačina poprimiti oblik y = a + bx.

.

Upisuju se rezultati mjerenja i proračuna tabela 7.

Tabela 7
n x = m y \u003d r 2, 10 -2 mm 2 m-¯m (m-¯m) 2 (m-¯m)y y-bx-a, 10-4 (y - bx - a) 2, 10 -6
1 1 6.101 -2.5 6.25 -0.152525 12.01 1.44229
2 2 11.834 -1.5 2.25 -0.17751 -9.6 0.930766
3 3 17.808 -0.5 0.25 -0.08904 -7.2 0.519086
4 4 23.814 0.5 0.25 0.11907 -1.6 0.0243955
5 5 29.812 1.5 2.25 0.44718 3.28 0.107646
6 6 35.760 2.5 6.25 0.894 3.12 0.0975819
21 125.129 – 17.5 1.041175 – 3.12176
∑/n 3.5 20.8548333 – – – – –

Odabir tipa regresijske funkcije, tj. tip razmatranog modela zavisnosti Y od X (ili X od Y), na primjer, linearni model y x = a + bx, potrebno je odrediti specifične vrijednosti koeficijenata modela.

Za različite vrijednosti a i b moguće je konstruirati beskonačan broj ovisnosti oblika y x =a+bx, tj. postoji beskonačan broj linija na koordinatnoj ravni, ali nam je potrebna takva ovisnost da na najbolji način odgovara uočenim vrijednostima. Dakle, problem se svodi na izbor najboljih koeficijenata.

Tražimo linearnu funkciju a + bx, samo na osnovu određenog broja dostupnih opservacija. Da bismo pronašli funkciju koja najbolje odgovara promatranim vrijednostima, koristimo metodu najmanjih kvadrata.

Označiti: Y i - vrijednost izračunata jednadžbom Y i =a+bx i . y i - izmjerena vrijednost, ε i =y i -Y i - razlika između izmjerenih i izračunatih vrijednosti, ε i =y i -a-bx i .

Metoda najmanjih kvadrata zahtijeva da ε i , razlika između izmjerenog y i i vrijednosti Y i izračunatih iz jednačine, bude minimalna. Stoga nalazimo koeficijente a i b tako da je zbir kvadrata odstupanja posmatranih vrijednosti od vrijednosti na pravoj regresijskoj liniji najmanji:

Istražujući ovu funkciju argumenata a i uz pomoć izvoda do ekstrema, možemo dokazati da funkcija poprima minimalnu vrijednost ako su koeficijenti a i b rješenja sistema:

(2)

Ako obje strane normalne jednadžbe podijelimo sa n, dobićemo:

S obzirom na to (3)

Get , odavde, zamjenom vrijednosti a u prvoj jednačini, dobijamo:

U ovom slučaju, b se naziva koeficijent regresije; a se naziva slobodnim članom regresijske jednadžbe i izračunava se po formuli:

Rezultirajuća ravna linija je procjena teorijske linije regresije. Imamo:

dakle, je jednačina linearne regresije.

Regresija može biti direktna (b>0) i inverzna (b Primjer 1. Rezultati mjerenja X i Y vrijednosti su dati u tabeli:

x i -2 0 1 2 4
y i 0.5 1 1.5 2 3

Uz pretpostavku da postoji linearna veza između X i Y y=a+bx, odredite koeficijente a i b koristeći metodu najmanjih kvadrata.

Rješenje. Ovdje je n=5
x i =-2+0+1+2+4=5;
x i 2 =4+0+1+4+16=25
x i y i =-2 0,5+0 1+1 1,5+2 2+4 3=16,5
y i =0,5+1+1,5+2+3=8

a normalni sistem (2) ima oblik

Rješavajući ovaj sistem dobijamo: b=0,425, a=1,175. Prema tome y=1,175+0,425x.

Primjer 2. Postoji uzorak od 10 opservacija ekonomskih indikatora (X) i (Y).

x i 180 172 173 169 175 170 179 170 167 174
y i 186 180 176 171 182 166 182 172 169 177

Potrebno je pronaći jednadžbu uzorka regresije Y na X. Konstruirati liniju uzorka regresije Y na X.

Rješenje. 1. Razvrstajmo podatke po vrijednostima x i i y i . Dobijamo novi sto:

x i 167 169 170 170 172 173 174 175 179 180
y i 169 171 166 172 180 176 177 182 182 186

Da bismo pojednostavili proračune, sastavit ćemo proračunsku tablicu u koju ćemo unijeti potrebne numeričke vrijednosti.

x i y i x i 2 x i y i
167 169 27889 28223
169 171 28561 28899
170 166 28900 28220
170 172 28900 29240
172 180 29584 30960
173 176 29929 30448
174 177 30276 30798
175 182 30625 31850
179 182 32041 32578
180 186 32400 33480
∑x i =1729 ∑y i =1761 ∑x i 2 299105 ∑x i y i =304696
x=172,9 y=176,1 x i 2 =29910,5 xy=30469.6

Prema formuli (4) izračunavamo koeficijent regresije

i po formuli (5)

Dakle, jednadžba regresije uzorka izgleda kao y=-59,34+1,3804x.
Nacrtajmo tačke (x i ; y i) na koordinatnoj ravni i označimo liniju regresije.


Slika 4

Slika 4 pokazuje kako se posmatrane vrednosti nalaze u odnosu na liniju regresije. Za numeričku procjenu odstupanja y i od Y i, gdje su y i uočene vrijednosti, a Y i vrijednosti određene regresijom, napravićemo tabelu:

x i y i Y i Y i -y i
167 169 168.055 -0.945
169 171 170.778 -0.222
170 166 172.140 6.140
170 172 172.140 0.140
172 180 174.863 -5.137
173 176 176.225 0.225
174 177 177.587 0.587
175 182 178.949 -3.051
179 182 184.395 2.395
180 186 185.757 -0.243

Y i vrijednosti se izračunavaju prema jednadžbi regresije.

Primjetno odstupanje nekih uočenih vrijednosti od linije regresije objašnjava se malim brojem zapažanja. Prilikom proučavanja stepena linearne zavisnosti Y od X, uzima se u obzir broj posmatranja. Jačina zavisnosti je određena vrijednošću koeficijenta korelacije.

Problem je pronaći koeficijente linearne zavisnosti za koje je funkcija dvije varijable A I b uzima najmanju vrijednost. Odnosno, s obzirom na podatke A I b zbir kvadrata odstupanja eksperimentalnih podataka od pronađene prave će biti najmanji. Ovo je cijela poenta metode najmanjih kvadrata.

Dakle, rješenje primjera se svodi na pronalaženje ekstrema funkcije dvije varijable.

Izvođenje formula za pronalaženje koeficijenata. Sastavlja se i rješava sistem dvije jednačine sa dvije nepoznate. Pronalaženje parcijalnih izvoda funkcija po varijablama A I b, izjednačavamo ove izvode sa nulom.

Rezultirajući sistem jednadžbi rješavamo bilo kojom metodom (na primjer, metodom zamjene ili Cramerovom metodom) i dobijamo formule za pronalaženje koeficijenata metodom najmanjih kvadrata (LSM).

Sa podacima A I b funkcija uzima najmanju vrijednost.

To je cijela metoda najmanjih kvadrata. Formula za pronalaženje parametra a sadrži sume , , , i parametar n- količina eksperimentalnih podataka. Vrijednosti ovih suma se preporučuje da se izračunaju zasebno. Koeficijent b pronađeno nakon izračuna a.

Glavno područje primjene takvih polinoma je obrada eksperimentalnih podataka (izgradnja empirijskih formula). Činjenica je da će na interpolacijski polinom konstruiran iz vrijednosti funkcije dobivene uz pomoć eksperimenta snažno utjecati "eksperimentalni šum", štoviše, tokom interpolacije se interpolacijski čvorovi ne mogu ponoviti, tj. ne možete koristiti rezultate ponovljenih eksperimenata pod istim uslovima. Srednji kvadratni polinom izglađuje šum i omogućava korištenje rezultata više eksperimenata.

Numerička integracija i diferencijacija. Primjer.

Numerička integracija- izračunavanje vrijednosti određenog integrala (po pravilu aproksimativno). Pod numeričkom integracijom se podrazumijeva skup numeričkih metoda za pronalaženje vrijednosti određenog integrala.

Numerička diferencijacija– skup metoda za izračunavanje vrijednosti izvoda diskretno zadane funkcije.

Integracija

Formulacija problema. Matematička formulacija problema: potrebno je pronaći vrijednost određenog integrala

gdje su a, b konačni, f(x) je kontinuiran na [a, b].

Prilikom rješavanja praktičnih problema često se dešava da je integral nezgodno ili nemoguće analitički uzeti: možda se ne može izraziti u elementarnim funkcijama, integrand se može dati u obliku tabele itd. U takvim slučajevima se koriste metode numeričke integracije. korišteno. Metode numeričke integracije koriste zamjenu površine krivolinijskog trapeza konačnim zbirom površina jednostavnijih geometrijskih oblika koji se mogu točno izračunati. U tom smislu se govori o upotrebi kvadraturnih formula.

Većina metoda koristi predstavljanje integrala kao konačan zbir (kvadraturna formula):

Kvadraturne formule zasnovane su na ideji zamjene grafa integranda na integracijskom intervalu funkcijama jednostavnijeg oblika, koje se lako analitički integriraju i stoga lako izračunavaju. Najjednostavniji zadatak konstruisanja kvadraturnih formula realizuje se za polinomske matematičke modele.

Mogu se razlikovati tri grupe metoda:

1. Metoda sa podjelom segmenta integracije na jednake intervale. Podjela na intervale se vrši unaprijed, obično se intervali biraju jednaki (da bi se lakše izračunala funkcija na krajevima intervala). Izračunajte površine i sabijte ih (metode pravougaonika, trapeza, Simpsona).

2. Metode sa particioniranjem segmenta integracije pomoću posebnih tačaka (Gaussova metoda).

3. Izračunavanje integrala korištenjem slučajnih brojeva (Monte Carlo metoda).

Metoda pravougaonika. Neka je funkcija (crtež) numerički integrirana na segmentu . Segment dijelimo na N jednakih intervala. Površina svakog od N krivolinijskih trapeza može se zamijeniti površinom pravokutnika.

Širina svih pravougaonika je ista i jednaka je:

Kao izbor visine pravokutnika, možete odabrati vrijednost funkcije na lijevoj ivici. U ovom slučaju, visina prvog pravougaonika će biti f(a), drugog će biti f(x 1),…, N-f(N-1).

Ako kao izbor visine pravougaonika uzmemo vrijednost funkcije na desnom rubu, tada će u ovom slučaju visina prvog pravokutnika biti f (x 1), drugog - f (x 2), . .., N - f (x N).

Kao što se može vidjeti, u ovom slučaju jedna od formula daje aproksimaciju integralu sa viškom, a druga s nedostatkom. Postoji još jedan način - koristiti vrijednost funkcije u sredini segmenta integracije za aproksimaciju:

Procjena apsolutne greške metode pravokutnika (sredina)

Procjena apsolutne greške metoda lijevog i desnog pravokutnika.

Primjer. Izračunajte za cijeli interval i podijelite interval na četiri dijela

Rješenje. Analitički proračun ovog integrala daje I=arctg(1)–arctg(0)=0,7853981634. u našem slučaju:

1) h = 1; xo = 0; x1 = 1;

2) h = 0,25 (1/4); x0 = 0; x1 = 0,25; x2 = 0,5; x3 = 0,75; x4 = 1;

Računamo metodom lijevog pravougaonika:

Računamo metodom pravougaonika:

Izračunajte metodom prosječnih pravokutnika:

Trapezoidna metoda. Korišćenjem polinoma prvog stepena za interpolaciju (prava linija povučena kroz dve tačke) dolazi se do formule trapeza. Krajevi segmenta integracije uzimaju se kao interpolacijski čvorovi. Dakle, krivolinijski trapez je zamijenjen običnim trapezom, čija se površina može naći kao proizvod polovine zbira baza i visine

U slučaju N segmenata integracije za sve čvorove, osim za krajnje tačke segmenta, vrijednost funkcije će biti uključena u ukupni zbir dva puta (pošto susjedni trapezi imaju jednu zajedničku stranu)

Formula trapeza se može dobiti uzimanjem polovine zbroja formula pravokutnika duž desne i lijeve ivice segmenta:

Provjera stabilnosti otopine. Po pravilu, što je kraća dužina svakog intervala, tj. što je veći broj ovih intervala, manja je razlika između približnih i tačnih vrijednosti integrala. To vrijedi za većinu funkcija. U trapezoidnoj metodi greška u izračunavanju integrala ϭ je približno proporcionalna kvadratu koraka integracije (ϭ ~ h 2), pa je za izračunavanje integrala određene funkcije u granicama a, b potrebno podijeliti segment na N 0 intervala i pronaći zbir površina trapeza. Zatim morate povećati broj intervala N 1, ponovo izračunati zbroj trapeza i usporediti rezultirajuću vrijednost s prethodnim rezultatom. Ovo treba ponavljati sve dok (N i) dok se ne postigne specificirana tačnost rezultata (kriterijum konvergencije).

Za metode pravokutnika i trapeza, obično u svakom koraku iteracije, broj intervala se povećava za faktor 2 (N i +1 =2N i).

Kriterijum konvergencije:

Glavna prednost trapeznog pravila je njegova jednostavnost. Međutim, ako integracija zahtijeva visoku preciznost, ova metoda može zahtijevati previše iteracija.

Apsolutna greška trapezoidne metode ocijenjeno kao
.

Primjer. Izračunajte približno određeni integral koristeći formulu trapeza.

a) Podjela segmenta integracije na 3 dijela.
b) Podjela segmenta integracije na 5 dijelova.

Rješenje:
a) Po uslovu, segment integracije se mora podijeliti na 3 dijela, tj.
Izračunajte dužinu svakog segmenta particije: .

Dakle, opća formula trapeza svedena je na ugodnu veličinu:

konačno:

Podsjećam vas da je dobivena vrijednost približna vrijednost površine.

b) Integracijski segment dijelimo na 5 jednakih dijelova, tj. povećanjem broja segmenata povećavamo tačnost proračuna.

Ako je , tada formula trapeza ima sljedeći oblik:

Nađimo korak particioniranja:
, odnosno dužina svakog međusegmenta je 0,6.

Kada završite zadatak, zgodno je sastaviti sve izračune s tablicom proračuna:

U prvom redu pišemo "counter"

Kao rezultat:

Pa, zaista postoji pojašnjenje, i to ozbiljno!
Ako za 3 segmenta particije, onda za 5 segmenata. Ako uzmete još više segmenta => biće još preciznije.

Simpsonova formula. Formula trapeza daje rezultat koji jako zavisi od veličine koraka h, što utiče na tačnost izračunavanja određenog integrala, posebno u slučajevima kada je funkcija nemonotona. Može se pretpostaviti povećanje tačnosti proračuna ako, umjesto segmenata pravih linija koji zamjenjuju krivolinijske fragmente grafa funkcije f(x), koristimo, na primjer, fragmente parabola date kroz tri susjedne točke grafa . Slična geometrijska interpretacija leži u osnovi Simpsonove metode za izračunavanje određenog integrala. Cijeli interval integracije a,b podijeljen je na N segmenata, dužina segmenta će također biti jednaka h=(b-a)/N.

Simpsonova formula je:

ostatak mandata

S povećanjem dužine segmenata, točnost formule se smanjuje, pa se za povećanje točnosti koristi kompozitna Simpsonova formula. Cijeli interval integracije je podijeljen na paran broj identičnih segmenata N, dužina segmenta će također biti jednaka h=(b-a)/N. Kompozitna Simpsonova formula je:

U formuli, izrazi u zagradama su zbroji vrijednosti integranda, odnosno na krajevima neparnih i parnih unutrašnjih segmenata.

Preostali član Simpsonove formule već je proporcionalan četvrtom stepenu koraka:

primjer: Izračunajte integral koristeći Simpsonovo pravilo. (Tačno rješenje - 0,2)

Gaussova metoda

Gausova kvadraturna formula. Osnovni princip kvadraturnih formula druge varijante vidljiv je sa slike 1.12: potrebno je postaviti tačke na takav način X 0 i X 1 unutar segmenta [ a;b] tako da su površine "trouglova" ukupno jednake površinama "segmenta". Kada se koristi Gaussova formula, početni segment [ a;b] se svodi na interval [-1;1] promjenom varijable X on

0.5∙(ba)∙t+ 0.5∙(b + a).

Onda , Gdje .

Ova zamjena je moguća ako a I b su konačne, a funkcija f(x) je kontinuirano na [ a;b]. Gaussova formula za n bodova x i, i=0,1,..,n-1 unutar segmenta [ a;b]:

, (1.27)

Gdje t i I Ai za razne n date su u priručniku. Na primjer, kada n=2 A 0 =A 1=1; at n=3: t 0 =t 2" 0,775, t 1 =0, A 0 =A 2" 0,555, A 1" 0,889.

Gaussova kvadraturna formula

dobijeno sa težinskom funkcijom jednakom jedan p(x)= 1 i čvorovi x i, koji su korijeni Legendreovih polinoma

Odds Ai lako izračunati po formulama

i=0,1,2,...n.

Vrijednosti čvorova i koeficijenata za n=2,3,4,5 date su u tabeli

Red Čvorovi Odds
n=2 x 1=0 x 0 =-x2=0.7745966692 A 1=8/9 A 0 = A 2=5/9
n=3 x 2 =-x 1=0.3399810436 x 3 =-x0=0.8611363116 A 1 =A 2=0.6521451549 A 0 = A 3=0.6521451549
n=4 x 2 = 0 x 3 = -x 1 = 0.5384693101 x 4 =-x 0 =0.9061798459 A 0 =0.568888899 A 3 =A 1 =0.4786286705 A 0 =A 4 =0.2869268851
n=5 x 5 = -x 0 =0.9324695142 x 4 = -x 1 =0.6612093865 x 3 = -x 2 =0.2386191861 A 5 =A 0 =0.1713244924 A 4 =A 1 =0.3607615730 A 3 =A 2 =0.4679139346

Primjer. Izračunajte vrijednost koristeći Gaussovu formulu za n=2:

Tačna vrijednost: .

Algoritam za izračunavanje integrala prema Gaussovoj formuli ne predviđa udvostručenje broja mikrosegmenata, već povećanje broja ordinata za 1 i poređenje dobivenih vrijednosti integrala. Prednost Gaussove formule je visoka preciznost sa relativno malim brojem ordinata. Nedostaci: nezgodno za ručne proračune; moraju biti pohranjeni u memoriji računara t i, Ai za razne n.

Greška Gaussove kvadraturne formule na segmentu će biti istovremeno. Za formulu ostatka člana će biti koeficijent α N brzo opada s rastom N. Evo

Gaussove formule daju visoku tačnost već sa malim brojem čvorova (od 4 do 10).U ovom slučaju, u praktičnim proračunima, broj čvorova se kreće od nekoliko stotina do nekoliko hiljada. Također napominjemo da su težine Gaussovih kvadratura uvijek pozitivne, što osigurava stabilnost algoritma za izračunavanje suma

Gore