Linearna regresija. Korištenje metode najmanjih kvadrata (LSM). Aproksimacija eksperimentalnih podataka. Metoda najmanjih kvadrata Metoda najmanjih kvadrata u slučaju 3 varijable

Koji nalazi najširu primjenu u raznim područjima znanosti i prakse. To može biti fizika, kemija, biologija, ekonomija, sociologija, psihologija i tako dalje i tako dalje. Voljom sudbine, često se moram baviti ekonomijom, pa ću vam danas organizirati kartu za nevjerojatnu zemlju zvanu Ekonometrija=) … Kako to ne želite?! Tamo je jako dobro - samo se trebate odlučiti! ...Ali ono što vjerojatno sigurno želite je naučiti kako rješavati probleme najmanjih kvadrata. A posebno marljivi čitatelji naučit će ih riješiti ne samo točno, već i VRLO BRZO ;-) Ali prvo opća izjava problema+ povezani primjer:

Neka se u nekom predmetnom području proučavaju pokazatelji koji imaju kvantitativni izraz. U isto vrijeme, postoji svaki razlog za vjerovanje da pokazatelj ovisi o pokazatelju. Ova pretpostavka može biti i znanstvena hipoteza i utemeljena na elementarnom zdravom razumu. Ostavimo, međutim, znanost po strani i istražimo ukusnija područja – naime, trgovine mješovitom robom. Označiti sa:

– prodajni prostor trgovine mješovitom robom, m2,
- godišnji promet trgovine mješovitom robom, milijun rubalja.

Sasvim je jasno da što je veća površina trgovine, to je u većini slučajeva veći njen promet.

Pretpostavimo da nakon promatranja / pokusa / izračuna / plesa uz tamburu imamo na raspolaganju brojčane podatke:

Sa trgovinama mješovitom robom mislim da je sve jasno: - ovo je površina 1. trgovine, - njen godišnji promet, - površina 2. trgovine, - njen godišnji promet itd. Usput, uopće nije potrebno imati pristup povjerljivim materijalima - prilično točna procjena prometa može se dobiti pomoću matematička statistika. Međutim, ne dajte se omesti, tečaj komercijalne špijunaže je već plaćen =)

Tablični podaci također se mogu napisati u obliku točaka i prikazati na uobičajeni način za nas. Kartezijanski sustav .

Odgovorimo na važno pitanje: koliko bodova je potrebno za kvalitativni studij?

Što veće, to bolje. Minimalni dopušteni skup sastoji se od 5-6 bodova. Osim toga, s malom količinom podataka, "abnormalni" rezultati ne bi trebali biti uključeni u uzorak. Tako, na primjer, mala elitna trgovina može pomoći redovima veličine više od "njihovih kolega", iskrivljujući tako opći obrazac koji treba pronaći!

Ako je sasvim jednostavno, moramo odabrati funkciju, raspored koja prolazi što bliže točkama . Takva se funkcija naziva aproksimirajući (aproksimacija - aproksimacija) ili teorijska funkcija . Općenito govoreći, ovdje se odmah pojavljuje očiti "pretendent" - polinom visokog stupnja, čiji graf prolazi kroz SVE točke. Ali ova je opcija komplicirana i često jednostavno netočna. (jer će grafikon cijelo vrijeme "vijugati" i slabo odražavati glavni trend).

Dakle, željena funkcija mora biti dovoljno jednostavna i istovremeno adekvatno odražavati ovisnost. Kao što možete pogoditi, jedna od metoda za pronalaženje takvih funkcija je poziv najmanjih kvadrata. Prvo, analizirajmo njegovu bit na opći način. Neka neka funkcija aproksimira eksperimentalne podatke:


Kako procijeniti točnost ove aproksimacije? Izračunajmo i razlike (odstupanja) između eksperimentalnih i funkcionalnih vrijednosti (proučavamo crtež). Prva pomisao koja pada na pamet je procijeniti koliki je zbroj, no problem je što razlike mogu biti negativne. (Na primjer, ) a odstupanja kao rezultat takvog zbrajanja međusobno će se poništiti. Stoga, kao procjena točnosti aproksimacije, predlaže se uzeti zbroj moduli odstupanja:

ili u presavijenom obliku: (odjednom, tko ne zna: je li ikona zbroja, a je li pomoćna varijabla-"brojač", koja uzima vrijednosti od 1 do ).

Aproksimacijom eksperimentalnih točaka različitim funkcijama dobit ćemo različite vrijednosti , a očito je da tamo gdje je taj zbroj manji ta je funkcija točnija.

Takva metoda postoji i zove se metoda najmanjeg modula. Međutim, u praksi je postalo mnogo raširenije. metoda najmanjih kvadrata, u kojem se moguće negativne vrijednosti eliminiraju ne modulom, već kvadratom odstupanja:

, nakon čega se napori usmjeravaju na izbor takve funkcije da zbroj kvadrata odstupanja bila što manja. Zapravo, otuda i naziv metode.

A sada se vraćamo na još jednu važnu točku: kao što je gore navedeno, odabrana funkcija bi trebala biti prilično jednostavna - ali postoji i mnogo takvih funkcija: linearni , hiperboličan, eksponencijalni, logaritamski, kvadratni itd. I, naravno, ovdje bih odmah želio "smanjiti polje djelovanja". Koju klasu funkcija odabrati za istraživanje? Primitivna, ali učinkovita tehnika:

- Najlakši način za crtanje bodova na crtežu i analizirati njihov položaj. Ako imaju tendenciju da budu u ravnoj liniji, onda biste trebali tražiti jednadžba ravne linije s optimalnim vrijednostima i . Drugim riječima, zadatak je pronaći TAKVE koeficijente - da zbroj kvadrata odstupanja bude najmanji.

Ako se točke nalaze, na primjer, duž hiperbola, onda je jasno da će linearna funkcija dati lošu aproksimaciju. U ovom slučaju tražimo "najpovoljnije" koeficijente za jednadžbu hiperbole - one koje daju minimalni zbroj kvadrata .

Sada primijetite da u oba slučaja govorimo funkcije dviju varijabli, čiji su argumenti pretraživali opcije ovisnosti:

A u biti treba riješiti standardni problem – pronaći minimum funkcije dviju varijabli.

Prisjetite se našeg primjera: pretpostavimo da su točke "prodavnice" obično smještene u ravnoj liniji i postoji svaki razlog za vjerovanje prisutnosti linearna ovisnost promet iz trgovačkog prostora. Nađimo TAKVE koeficijente "a" i "be" tako da zbroj kvadrata odstupanja bio najmanji. Sve kao i obično - prvo parcijalne derivacije 1. reda. Prema pravilo linearnosti možete razlikovati odmah ispod ikone zbroja:

Ako želite koristiti ove podatke za esej ili seminarski rad, bit ću vam vrlo zahvalan na poveznici na popisu izvora, tako detaljne izračune nećete naći nigdje:

Napravimo standardni sustav:

Svaku jednadžbu smanjujemo za “dvojku” i dodatno “rastavljamo” zbrojeve:

Bilješka : samostalno analizirati zašto se "a" i "be" mogu izbaciti iz ikone zbroja. Usput, formalno se to može učiniti sa zbrojem

Prepišimo sustav u "primijenjenom" obliku:

nakon čega se počinje iscrtavati algoritam za rješavanje našeg problema:

Znamo li koordinate točaka? Znamo. Zbrojevi možemo pronaći? Lako. Sastavljamo najjednostavnije sustav dviju linearnih jednadžbi s dvije nepoznanice("a" i "beh"). Sustav rješavamo npr. Cramerova metoda, što rezultira stacionarnom točkom . Provjeravanje dovoljan uvjet za ekstrem, možemo potvrditi da je u ovom trenutku funkcija doseže precizno minimum. Provjera je povezana s dodatnim izračunima i stoga ćemo je ostaviti iza scene. (po potrebi se može vidjeti okvir koji nedostaje). Izvodimo konačni zaključak:

Funkcija najbolji način (barem u usporedbi s bilo kojom drugom linearnom funkcijom) približava eksperimentalne točke . Grubo govoreći, njegov graf prolazi što je moguće bliže tim točkama. U tradiciji ekonometrija naziva se i rezultirajuća aproksimirajuća funkcija jednadžba uparene linearne regresije .

Problem koji se razmatra je od velike praktične važnosti. U situaciji s našim primjerom, jednadžba omogućuje vam predviđanje vrste prometa ("jig")će biti u trgovini s ovom ili onom vrijednošću prodajnog prostora (jedno ili drugo značenje "x"). Da, dobivena prognoza bit će samo prognoza, ali će se u mnogim slučajevima pokazati prilično točnom.

Analizirat ću samo jedan problem sa "pravim" brojevima, jer nema poteškoća u tome - svi izračuni su na razini školskog programa u 7-8 razredima. U 95 posto slučajeva od vas će se tražiti da pronađete samo linearnu funkciju, ali na samom kraju članka pokazat ću da nije ništa teže pronaći jednadžbe za optimalnu hiperbolu, eksponent i neke druge funkcije.

Zapravo, ostaje distribuirati obećane dobrote - tako da naučite kako rješavati takve primjere ne samo točno, već i brzo. Pažljivo proučavamo standard:

Zadatak

Kao rezultat proučavanja odnosa između dva pokazatelja, dobiveni su sljedeći parovi brojeva:

Koristeći metodu najmanjih kvadrata, pronađite linearnu funkciju koja najbolje aproksimira empirijsku (iskusan) podaci. Napravite crtež na kojemu u kartezijskom pravokutnom koordinatnom sustavu ucrtajte eksperimentalne točke i graf aproksimativne funkcije . Nađite zbroj kvadrata odstupanja između empirijskih i teoretskih vrijednosti. Saznajte je li funkcija bolja (u smislu metode najmanjih kvadrata) približne eksperimentalne točke.

Imajte na umu da su vrijednosti "x" prirodne vrijednosti, a to ima karakteristično smisleno značenje, o kojem ću govoriti malo kasnije; ali oni, naravno, mogu biti frakcijski. Osim toga, ovisno o sadržaju pojedinog zadatka, i "X" i "G" vrijednosti mogu biti potpuno ili djelomično negativne. Pa, dobili smo “bezlični” zadatak i mi ga krećemo riješenje:

Koeficijente optimalne funkcije nalazimo kao rješenje sustava:

U svrhu kompaktnijeg zapisa, varijabla “brojač” može se izostaviti, jer je već jasno da se zbrajanje provodi od 1 do .

Pogodnije je izračunati potrebne količine u tabličnom obliku:


Izračuni se mogu provesti na mikrokalkulatoru, ali mnogo je bolje koristiti Excel - i brže i bez pogrešaka; pogledajte kratki video:

Dakle, dobivamo sljedeće sustav:

Ovdje možete pomnožiti drugu jednadžbu s 3 i oduzmite 2. od 1. jednadžbe član po član. Ali to je sreća - u praksi sustavi često nisu nadareni, au takvim slučajevima štedi Cramerova metoda:
, tako da sustav ima jedinstveno rješenje.

Napravimo provjeru. Razumijem da ne želim, ali zašto preskakati greške tamo gdje ih apsolutno ne možete propustiti? Nađeno rješenje zamijenite u lijevu stranu svake jednadžbe sustava:

Dobiveni su pravi dijelovi odgovarajućih jednadžbi, što znači da je sustav ispravno riješen.

Dakle, željena aproksimativna funkcija: – od sve linearne funkcije njime se najbolje približavaju eksperimentalni podaci.

Za razliku od ravno ovisnost prometa trgovine o njezinoj površini, utvrđena ovisnost je obrnuti (princip "što više - to manje"), a tu činjenicu odmah otkriva negativ kutni koeficijent. Funkcija obavještava nas da povećanjem određenog pokazatelja za 1 jedinicu vrijednost ovisnog pokazatelja opada prosjek za 0,65 jedinica. Kako kažu, što je veća cijena heljde, to se manje prodaje.

Da bismo nacrtali funkciju aproksimacije, pronalazimo dvije njene vrijednosti:

i izvršite crtež:


Konstruirana linija naziva se linija trenda (naime, linearna linija trenda, tj. u općem slučaju, trend nije nužno ravna linija). Svima je poznat izraz "biti u trendu" i mislim da ovaj termin ne treba dodatno komentirati.

Izračunajte zbroj kvadrata odstupanja između empirijskih i teorijskih vrijednosti. Geometrijski, to je zbroj kvadrata duljina "grimiznih" segmenata (od kojih su dva toliko mala da ih ni ne možete vidjeti).

Sažmimo izračune u tablicu:


Ponovno se mogu izvršiti ručno, za svaki slučaj dat ću primjer za 1. točku:

ali puno je učinkovitije raditi na već poznati način:

Ponovimo: koje je značenje rezultata? Iz sve linearne funkcije funkcija eksponent je najmanji, odnosno najbolja je aproksimacija u svojoj obitelji. I ovdje, usput, posljednje pitanje problema nije slučajno: što ako je predložena eksponencijalna funkcija hoće li biti bolje aproksimirati eksperimentalne točke?

Nađimo odgovarajući zbroj kvadrata odstupanja - da ih razlikujem, označit ću ih slovom "epsilon". Tehnika je potpuno ista:


I opet za svaki proračun požara za 1. točku:

U Excelu koristimo standardnu ​​funkciju EXP (Sintaksu možete pronaći u Excel pomoći).

Zaključak: , pa eksponencijalna funkcija lošije aproksimira eksperimentalne točke nego ravna linija .

Ali ovdje treba napomenuti da je "gore". ne znači još, što nije u redu. Sada sam napravio graf ove eksponencijalne funkcije - i on također prolazi blizu točaka - toliko da je bez analitičke studije teško reći koja je funkcija točnija.

Ovim je rješenje završeno i vraćam se na pitanje prirodnih vrijednosti argumenta. U raznim se studijama, u pravilu, ekonomskim ili sociološkim, prirodnim "X" označavaju mjeseci, godine ili drugi jednaki vremenski intervali. Razmotrimo, na primjer, takav problem.

Primjer.

Eksperimentalni podaci o vrijednostima varijabli x I na dati su u tablici.

Kao rezultat njihova poravnanja, funkcija

Korištenje metoda najmanjih kvadrata, aproksimirajte ove podatke linearnom ovisnošću y=ax+b(pronađi opcije A I b). Utvrdite koja od dvije linije bolje (u smislu metode najmanjih kvadrata) usklađuje eksperimentalne podatke. Napravite crtež.

Bit metode najmanjih kvadrata (LSM).

Problem je pronaći koeficijente linearne ovisnosti za koje je funkcija dviju varijabli A I b uzima najmanju vrijednost. Odnosno s obzirom na podatke A I b zbroj kvadrata odstupanja eksperimentalnih podataka od nađene ravne linije bit će najmanji. Ovo je cijela poanta metode najmanjih kvadrata.

Dakle, rješenje primjera se svodi na pronalaženje ekstremuma funkcije dviju varijabli.

Izvođenje formula za određivanje koeficijenata.

Sastavlja se i rješava sustav dviju jednadžbi s dvije nepoznanice. Određivanje parcijalnih izvoda funkcija po varijablama A I b, te izvodnice izjednačujemo s nulom.

Dobiveni sustav jednadžbi rješavamo bilo kojom metodom (npr metoda supstitucije ili Cramerova metoda) i dobiti formule za pronalaženje koeficijenata metodom najmanjih kvadrata (LSM).

S podacima A I b funkcija uzima najmanju vrijednost. Dokaz ove činjenice je dan ispod teksta na kraju stranice.

To je cijela metoda najmanjih kvadrata. Formula za pronalaženje parametra a sadrži zbrojeve ,,, i parametar n- količina eksperimentalnih podataka. Vrijednosti ovih zbrojeva preporučuje se zasebno izračunati. Koeficijent b pronađeno nakon proračuna a.

Vrijeme je da se prisjetimo izvornog primjera.

Riješenje.

U našem primjeru n=5. Ispunjavamo tablicu radi lakšeg izračunavanja iznosa koji su uključeni u formule potrebnih koeficijenata.

Vrijednosti u četvrtom retku tablice dobivene su množenjem vrijednosti 2. retka s vrijednostima 3. retka za svaki broj. ja.

Vrijednosti u petom retku tablice dobivene su kvadriranjem vrijednosti 2. retka za svaki broj ja.

Vrijednosti posljednjeg stupca tablice su zbrojevi vrijednosti u redovima.

Za pronalaženje koeficijenata koristimo se formulama metode najmanjih kvadrata A I b. Zamjenjujemo u njima odgovarajuće vrijednosti iz posljednjeg stupca tablice:

Stoga, y=0,165x+2,184 je željena aproksimativna ravna linija.

Ostaje otkriti koji od redaka y=0,165x+2,184 ili bolje aproksimira izvorne podatke, tj. napraviti procjenu metodom najmanjih kvadrata.

Procjena pogreške metode najmanjih kvadrata.

Da biste to učinili, morate izračunati zbrojeve kvadrata odstupanja izvornih podataka od ovih redaka I , manja vrijednost odgovara liniji koja bolje aproksimira izvorne podatke u smislu metode najmanjih kvadrata.

Budući da je , zatim linija y=0,165x+2,184 bolje približava izvorne podatke.

Grafički prikaz metode najmanjih kvadrata (LSM).

Na ljestvicama sve izgleda sjajno. Crvena linija je pronađena linija y=0,165x+2,184, plava linija je , ružičaste točkice su izvorni podaci.

U praksi, pri modeliranju različitih procesa - posebno ekonomskih, fizičkih, tehničkih, društvenih - naširoko se koristi jedna ili druga metoda izračunavanja približnih vrijednosti funkcija iz njihovih poznatih vrijednosti u nekim fiksnim točkama.

Često se javljaju problemi aproksimacije funkcija ove vrste:

    pri izradi približnih formula za izračunavanje vrijednosti karakterističnih veličina procesa koji se proučava prema tabličnim podacima dobivenim kao rezultat eksperimenta;

    u numeričkoj integraciji, diferencijaciji, rješavanju diferencijalnih jednadžbi itd.;

    ako je potrebno izračunati vrijednosti funkcija u srednjim točkama razmatranog intervala;

    pri određivanju vrijednosti karakterističnih veličina procesa izvan razmatranog intervala, posebno pri predviđanju.

Ako se za modeliranje određenog procesa određenog tablicom konstruira funkcija koja približno opisuje taj proces na temelju metode najmanjih kvadrata, ona će se zvati aproksimirajuća funkcija (regresija), a sam zadatak konstruiranja aproksimirajućih funkcija će biti problem aproksimacije.

U ovom se članku govori o mogućnostima MS Excel paketa za rješavanje ovakvih problema, a također se daju metode i tehnike konstruiranja (kreiranja) regresija za tablično zadane funkcije (što je temelj regresijske analize).

Postoje dvije mogućnosti za izradu regresija u Excelu.

    Dodavanje odabranih regresija (trendova) grafikonu izgrađenom na temelju tablice podataka za proučavanu karakteristiku procesa (dostupno samo ako je grafikon izgrađen);

    Korištenje ugrađenih statističkih funkcija radnog lista programa Excel, koje vam omogućuju dobivanje regresija (linija trenda) izravno iz tablice izvornih podataka.

Dodavanje linija trenda na grafikon

Za tablicu podataka koja opisuje određeni proces i predstavljena dijagramom, Excel ima učinkovit alat za regresijsku analizu koji vam omogućuje da:

    graditi na temelju metode najmanjih kvadrata i dodati dijagramu pet vrsta regresija koje modeliraju proces koji se proučava s različitim stupnjevima točnosti;

    dijagramu dodati jednadžbu konstruirane regresije;

    odrediti stupanj usklađenosti odabrane regresije s podacima prikazanim na grafikonu.

Na temelju podataka grafikona, Excel vam omogućuje da dobijete linearne, polinomske, logaritamske, eksponencijalne, eksponencijalne vrste regresija, koje su dane jednadžbom:

y = y(x)

gdje je x nezavisna varijabla, koja često uzima vrijednosti niza prirodnih brojeva (1; 2; 3; ...) i proizvodi, na primjer, odbrojavanje vremena procesa koji se proučava (karakteristike) .

1 . Linearna regresija je dobra u modeliranju značajki koje se povećavaju ili smanjuju konstantnom brzinom. Ovo je najjednostavniji model procesa koji se proučava. Izgrađen je prema jednadžbi:

y=mx+b

gdje je m tangens nagiba linearne regresije na x-os; b - koordinata točke presjeka linearne regresije s osi y.

2 . Polinomna linija trenda korisna je za opisivanje karakteristika koje imaju nekoliko različitih ekstrema (visoke i niske). Izbor stupnja polinoma određen je brojem ekstrema proučavane karakteristike. Dakle, polinom drugog stupnja može dobro opisati proces koji ima samo jedan maksimum ili minimum; polinom trećeg stupnja - ne više od dva ekstrema; polinom četvrtog stupnja - ne više od tri ekstrema itd.

U ovom slučaju, linija trenda izgrađena je u skladu s jednadžbom:

y = c0 + c1x + c2x2 + c3x3 + c4x4 + c5x5 + c6x6

gdje su koeficijenti c0, c1, c2,... c6 konstante čije se vrijednosti određuju tijekom konstrukcije.

3 . Logaritamska linija trenda uspješno se koristi u modeliranju karakteristika, čije se vrijednosti isprva brzo mijenjaju, a zatim se postupno stabiliziraju.

y = c ln(x) + b

4 . Linija trenda snage daje dobre rezultate ako vrijednosti proučavane ovisnosti karakteriziraju stalne promjene u stopi rasta. Primjer takve ovisnosti može poslužiti kao grafikon jednoliko ubrzanog kretanja automobila. Ako u podacima postoje nulte ili negativne vrijednosti, ne možete koristiti liniju trenda snage.

Izgrađen je u skladu s jednadžbom:

y = cxb

gdje su koeficijenti b, c konstante.

5 . Treba koristiti eksponencijalnu crtu trenda ako se stopa promjene podataka kontinuirano povećava. Za podatke koji sadrže nulte ili negativne vrijednosti, ova vrsta aproksimacije također nije primjenjiva.

Izgrađen je u skladu s jednadžbom:

y=cebx

gdje su koeficijenti b, c konstante.

Prilikom odabira linije trenda, Excel automatski izračunava vrijednost R2, koja karakterizira točnost aproksimacije: što je vrijednost R2 bliža jedinici, to linija trenda pouzdanije aproksimira proces koji se proučava. Ako je potrebno, vrijednost R2 uvijek se može prikazati na dijagramu.

Određeno formulom:

Da biste nizu podataka dodali liniju trenda:

    aktivirati grafikon izgrađen na temelju serije podataka, tj. kliknuti unutar područja grafikona. U glavnom izborniku pojavit će se stavka Grafikon;

    nakon klika na ovu stavku na ekranu će se pojaviti izbornik u kojem treba odabrati naredbu Dodaj liniju trenda.

Iste radnje lako se provode ako zadržite pokazivač iznad grafikona koji odgovara jednoj od serija podataka i kliknete desnom tipkom miša; u kontekstnom izborniku koji se pojavi odaberite naredbu Dodaj liniju trenda. Na zaslonu će se pojaviti dijaloški okvir Trendline s otvorenom karticom Vrsta (slika 1).

Nakon toga trebate:

Na kartici Vrsta odaberite željenu vrstu linije trenda (Linearna je odabrana prema zadanim postavkama). Za tip Polinom u polju Stupanj odredite stupanj odabranog polinoma.

1 . Polje Izgrađeno na seriji navodi sve serije podataka u dotičnom grafikonu. Da biste dodali crtu trenda određenoj seriji podataka, odaberite njen naziv u polju Izgrađeno na seriji.

Ako je potrebno, odlaskom na karticu Parametri (slika 2) možete postaviti sljedeće parametre za liniju trenda:

    promijenite naziv linije trenda u polju Naziv aproksimirajuće (izglađene) krivulje.

    postavite broj razdoblja (unaprijed ili unatrag) za prognozu u polju Prognoza;

    prikazati jednadžbu linije trenda u području grafikona, za što trebate uključiti potvrdni okvir prikaži jednadžbu na grafikonu;

    prikazati vrijednost pouzdanosti aproksimacije R2 u području dijagrama, za što treba uključiti potvrdni okvir staviti vrijednost pouzdanosti aproksimacije (R^2) na dijagram;

    postavite točku sjecišta linije trenda s Y-osi, za što treba uključiti potvrdni okvir za sjecište krivulje s Y-osi u točki;

    kliknite gumb U redu za zatvaranje dijaloškog okvira.

Postoje tri načina za početak uređivanja već izgrađene linije trenda:

    koristite naredbu Selected trend line iz izbornika Format, nakon odabira trend line;

    odaberite naredbu Format Trendline iz kontekstnog izbornika koji se poziva desnim klikom na crtu trenda;

    duplim klikom na liniju trenda.

Na ekranu će se pojaviti dijaloški okvir Format Trendline (Slika 3), koji sadrži tri kartice: View, Type, Parameters, a sadržaj posljednja dva potpuno se podudara sa sličnim karticama dijaloškog okvira Trendline (Slika 1-2). ). Na kartici Pogled možete postaviti vrstu linije, njenu boju i debljinu.

Za brisanje već izgrađene linije trenda odaberite liniju trenda koju želite obrisati i pritisnite tipku Delete.

Prednosti razmatranog alata za regresijsku analizu su:

    relativna jednostavnost iscrtavanja linije trenda na grafikonima bez stvaranja podatkovne tablice za nju;

    prilično širok popis vrsta predloženih linija trenda, a ovaj popis uključuje najčešće korištene vrste regresije;

    mogućnost predviđanja ponašanja procesa koji se proučava za proizvoljan (u okviru zdravog razuma) broj koraka naprijed, kao i natrag;

    mogućnost dobivanja jednadžbe linije trenda u analitičkom obliku;

    mogućnost, ako je potrebno, dobivanja ocjene pouzdanosti aproksimacije.

Nedostaci uključuju sljedeće točke:

    izgradnja linije trenda provodi se samo ako postoji grafikon izgrađen na nizu podataka;

    proces generiranja serije podataka za karakteristiku koja se proučava na temelju jednadžbi linije trenda dobivenih za nju je donekle pretrpan: željene regresijske jednadžbe ažuriraju se sa svakom promjenom vrijednosti izvorne serije podataka, ali samo unutar područja grafikona , dok serija podataka formirana na temelju trenda stare jednadžbe linije ostaje nepromijenjena;

    U izvješćima zaokretnog grafikona, kada promijenite prikaz grafikona ili pridruženo izvješće zaokretne tablice, postojeće linije trenda se ne čuvaju, što znači da prije crtanja linija trenda ili na drugi način formatirate izvješće zaokretnog grafikona, morate osigurati da izgled izvješća zadovoljava vaše zahtjeve.

Linije trenda mogu se dodati serijama podataka prikazanim na grafikonima kao što su grafikon, histogram, ravni nenormalizirani površinski grafikoni, stupčasti, raspršeni, mjehurasti i dionički grafikoni.

Ne možete dodati crte trenda serijama podataka na 3-D, standardnim, radarskim, kružnim i kružnim grafikonima.

Korištenje ugrađenih Excel funkcija

Excel također nudi alat za regresijsku analizu za iscrtavanje linija trenda izvan područja grafikona. Brojne funkcije statističkih radnih listova mogu se koristiti za ovu svrhu, ali sve one omogućuju izradu samo linearnih ili eksponencijalnih regresija.

Excel ima nekoliko funkcija za izradu linearne regresije, posebice:

    TREND;

  • KOSINA i USJEK.

Kao i nekoliko funkcija za konstruiranje eksponencijalne linije trenda, posebno:

    LGRFPpribližno

Treba napomenuti da su tehnike za konstruiranje regresija pomoću funkcija TREND i GROWTH praktički iste. Isto se može reći i za par funkcija LINEST i LGRFPRIBL. Za ove četiri funkcije, prilikom izrade tablice vrijednosti, koriste se značajke programa Excel kao što su formule polja, što donekle otežava proces izgradnje regresija. Također napominjemo da je konstrukciju linearne regresije, po našem mišljenju, najlakše implementirati pomoću funkcija SLOPE i INTERCEPT, gdje prva od njih određuje nagib linearne regresije, a druga određuje segment odsječen regresijom na y-osi.

Prednosti alata ugrađenih funkcija za regresijsku analizu su:

    prilično jednostavan proces istog tipa formiranja nizova podataka proučavanog obilježja za sve ugrađene statističke funkcije koje postavljaju linije trenda;

    standardna tehnika za konstruiranje linija trenda na temelju generiranih serija podataka;

    sposobnost predviđanja ponašanja procesa koji se proučava za potreban broj koraka naprijed ili natrag.

A nedostaci uključuju činjenicu da Excel nema ugrađene funkcije za stvaranje drugih (osim linearnih i eksponencijalnih) vrsta linija trenda. Ova okolnost često ne dopušta odabir dovoljno preciznog modela procesa koji se proučava, kao i dobivanje prognoza bliskih stvarnosti. Osim toga, kada se koriste funkcije TREND i GROW, jednadžbe linija trenda nisu poznate.

Valja napomenuti da autori nisu postavili cilj članka prikazati tijek regresijske analize s različitim stupnjevima potpunosti. Glavni zadatak mu je na konkretnim primjerima prikazati mogućnosti Excel paketa u rješavanju aproksimacijskih problema; pokazati koje učinkovite alate Excel ima za izradu regresija i predviđanja; ilustriraju kako relativno lako takve probleme može riješiti čak i korisnik koji nema duboko znanje regresijske analize.

Primjeri rješavanja konkretnih problema

Razmotrite rješenje konkretnih problema pomoću navedenih alata Excel paketa.

Zadatak 1

Uz tablicu podataka o dobiti autotransportnog poduzeća za 1995.-2002. trebate učiniti sljedeće.

    Izgradite grafikon.

    Dodajte linearne i polinomske (kvadratne i kubične) linije trenda na grafikon.

    Pomoću jednadžbi linije trenda dobiti tablične podatke o dobiti poduzeća za svaku liniju trenda za 1995.-2004.

    Napravite prognozu dobiti poduzeća za 2003. i 2004. godinu.

Rješenje problema

    U raspon ćelija A4:C11 Excel radnog lista upisujemo radni list prikazan na sl. 4.

    Odabirom raspona ćelija B4:C11 gradimo grafikon.

    Aktiviramo konstruirani grafikon i koristeći gore opisanu metodu, nakon odabira vrste linije trenda u dijaloškom okviru Trend Line (vidi sl. 1), naizmjenično dodajemo linearne, kvadratne i kubične linije trenda na grafikon. U istom dijaloškom okviru otvorite karticu Parametri (vidi sl. 2), u polje Naziv aproksimirajuće (izglađene) krivulje unesite naziv trenda koji želite dodati, a u polje Prognoza naprijed za: razdoblja postavite vrijednost 2, jer se planira napraviti prognoza dobiti za dvije godine unaprijed. Za prikaz regresijske jednadžbe i vrijednosti aproksimacijske pouzdanosti R2 u području dijagrama, uključite potvrdne okvire Prikaži jednadžbu na ekranu i postavite vrijednost aproksimacijske pouzdanosti (R^2) na dijagram. Za bolju vizualnu percepciju mijenjamo vrstu, boju i debljinu iscrtanih linija trenda, za što koristimo karticu View dijaloškog okvira Format linije trenda (vidi sl. 3). Rezultirajući grafikon s dodanim linijama trenda prikazan je na sl. 5.

    Za dobivanje tabličnih podataka o dobiti poduzeća za svaku liniju trenda za 1995.-2004. Upotrijebimo jednadžbe linija trenda prikazane na sl. 5. Da biste to učinili, u ćelije raspona D3:F3 unesite tekstualne informacije o vrsti odabrane linije trenda: Linearni trend, Kvadratni trend, Kubični trend. Zatim unesite formulu linearne regresije u ćeliju D4 i pomoću markera za popunjavanje kopirajte ovu formulu s relativnim referencama na raspon ćelija D5:D13. Treba napomenuti da svaka ćelija s formulom linearne regresije iz raspona ćelija D4:D13 ima odgovarajuću ćeliju iz raspona A4:A13 kao argument. Slično, za kvadratnu regresiju popunjava se raspon ćelija E4:E13, a za kubičnu regresiju popunjava se raspon ćelija F4:F13. Tako je napravljena prognoza dobiti poduzeća za 2003. i 2004. godinu. s tri trenda. Rezultirajuća tablica vrijednosti prikazana je na sl. 6.

Zadatak 2

    Izgradite grafikon.

    Grafikonu dodajte logaritamske, eksponencijalne i eksponencijalne linije trenda.

    Izvedite jednadžbe dobivenih linija trenda, kao i vrijednosti aproksimacijske pouzdanosti R2 za svaku od njih.

    Pomoću jednadžbi linije trenda dobiti tablične podatke o dobiti poduzeća za svaku liniju trenda za 1995.-2002.

    Napravite prognozu dobiti za poslovanje za 2003. i 2004. koristeći ove linije trenda.

Rješenje problema

Slijedeći metodologiju danu u rješavanju zadatka 1, dobivamo dijagram s dodanim logaritamskim, eksponencijalnim i eksponencijalnim linijama trenda (slika 7). Nadalje, koristeći dobivene jednadžbe linije trenda, popunjavamo tablicu vrijednosti za dobit poduzeća, uključujući predviđene vrijednosti za 2003. i 2004. godinu. (slika 8).

Na sl. 5 i sl. vidljivo je da model s logaritamskim trendom odgovara najnižoj vrijednosti aproksimacijske pouzdanosti

R2 = 0,8659

Najveće vrijednosti R2 odgovaraju modelima s polinomskim trendom: kvadratni (R2 = 0,9263) i kubni (R2 = 0,933).

Zadatak 3

Uz tablicu podataka o dobiti autotransportnog poduzeća za 1995.-2002., danu u zadatku 1, morate izvršiti sljedeće korake.

    Dobijte serije podataka za linearne i eksponencijalne crte trenda pomoću funkcija TREND i GROW.

    Pomoću funkcija TREND i RAST napravite prognozu dobiti poduzeća za 2003. i 2004. godinu.

    Za početne podatke i primljene serije podataka konstruirajte dijagram.

Rješenje problema

Upotrijebimo radni list zadatka 1 (vidi sl. 4). Počnimo s funkcijom TREND:

    odaberite raspon ćelija D4: D11, koji treba ispuniti vrijednostima funkcije TREND koje odgovaraju poznatim podacima o dobiti poduzeća;

    pozovite naredbu Function iz izbornika Insert. U dijaloškom okviru čarobnjaka za funkcije koji se pojavi odaberite funkciju TREND iz kategorije Statistika, a zatim kliknite gumb U redu. Ista se operacija može izvršiti pritiskom na gumb (funkcija Umetanje) na standardnoj alatnoj traci.

    U dijaloškom okviru Argumenti funkcije koji se pojavi unesite raspon ćelija C4:C11 u polje Known_values_y; u polju Poznate_vrijednosti_x - raspon ćelija B4:B11;

    da bi unesena formula postala formula polja, koristite kombinaciju tipki + + .

Formula koju smo unijeli u traku formule izgledat će ovako: =(TREND(C4:C11;B4:B11)).

Kao rezultat toga, raspon ćelija D4:D11 ispunjen je odgovarajućim vrijednostima funkcije TREND (slika 9).

Izraditi prognozu dobiti poduzeća za 2003. i 2004. godinu. potrebno:

    odaberite raspon ćelija D12:D13, gdje će se unijeti vrijednosti predviđene funkcijom TREND.

    pozovite funkciju TREND i u dijaloškom okviru Function Arguments koji se pojavi unesite u polje Known_values_y - raspon ćelija C4:C11; u polju Poznate_vrijednosti_x - raspon ćelija B4:B11; a u polju Nove_vrijednosti_x - raspon ćelija B12:B13.

    pretvorite ovu formulu u formulu polja pomoću tipkovničkog prečaca Ctrl + Shift + Enter.

    Unesena formula izgledat će ovako: =(TREND(C4:C11;B4:B11;B12:B13)), a raspon ćelija D12:D13 popunit će se predviđenim vrijednostima funkcije TREND (vidi sl. 9).

Slično tome, niz podataka popunjava se pomoću funkcije GROWTH, koja se koristi u analizi nelinearnih ovisnosti i radi potpuno isto kao i njezin linearni pandan TREND.

Slika 10 prikazuje tablicu u načinu prikaza formule.

Za početne podatke i dobivene serije podataka, dijagram prikazan na sl. jedanaest.

Zadatak 4

Uz tablicu podataka o primitku zahtjeva za usluge od strane dispečerske službe autoprijevoznika za razdoblje od 1. do 11. dana tekućeg mjeseca, potrebno je izvršiti sljedeće radnje.

    Dobivanje serije podataka za linearnu regresiju: ​​pomoću funkcija SLOPE i INTERCEPT; pomoću funkcije LINEST.

    Dohvatite niz podataka za eksponencijalnu regresiju pomoću funkcije LYFFPRIB.

    Koristeći gore navedene funkcije napravite prognozu zaprimanja zahtjeva u dispečersku službu za razdoblje od 12. do 14. dana u tekućem mjesecu.

    Za izvornu i primljenu seriju podataka konstruirajte dijagram.

Rješenje problema

Imajte na umu da, za razliku od funkcija TREND i GROW, nijedna od gore navedenih funkcija (SLOPE, INTERCEPTION, LINEST, LGRFPRIB) nije regresija. Ove funkcije imaju samo pomoćnu ulogu, određujući potrebne regresijske parametre.

Za linearne i eksponencijalne regresije izgrađene pomoću funkcija SLOPE, INTERCEPT, LINEST, LGRFINB, izgled njihovih jednadžbi je uvijek poznat, za razliku od linearnih i eksponencijalnih regresija koje odgovaraju funkcijama TREND i GROWTH.

1 . Izgradimo linearnu regresiju koja ima jednadžbu:

y=mx+b

pomoću funkcija SLOPE i INTERCEPT, pri čemu se nagib regresije m određuje funkcijom SLOPE, a konstantni član b - funkcijom INTERCEPT.

Da bismo to učinili, izvodimo sljedeće radnje:

    unesite izvornu tablicu u raspon ćelija A4:B14;

    vrijednost parametra m bit će određena u ćeliji C19. Odaberite iz Statističke kategorije funkciju Nagib; unesite raspon ćelija B4:B14 u polje poznate_vrijednosti_y i raspon ćelija A4:A14 u polje poznate_vrijednosti_x. Formula će se unijeti u ćeliju C19: =NAGIB(B4:B14;A4:A14);

    sličnom metodom određuje se vrijednost parametra b u ćeliji D19. A njegov sadržaj će izgledati ovako: = INTERCEPT(B4:B14;A4:A14). Dakle, vrijednosti parametara m i b, potrebne za konstrukciju linearne regresije, bit će pohranjene u ćelijama C19, D19;

    tada u ćeliju C4 unosimo formulu linearne regresije u obliku: = $ C * A4 + $ D. U ovoj formuli ćelije C19 i D19 su napisane s apsolutnim referencama (adresa ćelije se ne smije mijenjati s mogućim kopiranjem). Apsolutni referentni znak $ može se upisati s tipkovnice ili pomoću tipke F4, nakon postavljanja kursora na adresu ćelije. Koristeći ručicu za punjenje, kopirajte ovu formulu u raspon ćelija C4:C17. Dobivamo željeni niz podataka (slika 12). Zbog činjenice da je broj zahtjeva cijeli broj, trebate postaviti format broja na kartici Broj u prozoru Format ćelije s brojem decimalnih mjesta na 0.

2 . Izgradimo sada linearnu regresiju danu jednadžbom:

y=mx+b

pomoću funkcije LINEST.

Za ovo:

    unesite funkciju LINEST kao formulu polja u raspon ćelija C20:D20: =(LINEST(B4:B14;A4:A14)). Kao rezultat dobivamo vrijednost parametra m u ćeliji C20, a vrijednost parametra b u ćeliji D20;

    unesite formulu u ćeliju D4: =$C*A4+$D;

    kopirajte ovu formulu pomoću markera za popunjavanje u raspon ćelija D4:D17 i dobijete željenu seriju podataka.

3 . Gradimo eksponencijalnu regresiju koja ima jednadžbu:

uz pomoć LGRFPRIBL funkcije, to se izvodi na sličan način:

    u raspon ćelija C21:D21 unesite funkciju LGRFPRIBL kao formulu polja: =( LGRFPRIBL (B4:B14;A4:A14)). U ovom slučaju vrijednost parametra m bit će određena u ćeliji C21, a vrijednost parametra b bit će određena u ćeliji D21;

    formula se unosi u ćeliju E4: =$D*$C^A4;

    korištenjem markera za popunjavanje, ova se formula kopira u raspon ćelija E4:E17, gdje će se nalaziti serija podataka za eksponencijalnu regresiju (vidi sliku 12).

Na sl. 13 prikazuje tablicu u kojoj možemo vidjeti funkcije koje koristimo s potrebnim rasponima ćelija, kao i formule.

Vrijednost R 2 nazvao koeficijent determinacije.

Zadatak konstruiranja regresijske ovisnosti je pronaći vektor koeficijenata m modela (1) pri kojem koeficijent R poprima najveću vrijednost.

Za procjenu značajnosti R koristi se Fisherov F-test izračunat po formuli

Gdje n- veličina uzorka (broj pokusa);

k je broj koeficijenata modela.

Ako F prijeđe neku kritičnu vrijednost za podatke n I k i prihvaćenu razinu pouzdanosti, tada se vrijednost R smatra značajnom. Tablice kritičnih vrijednosti F dane su u referentnim knjigama o matematičkoj statistici.

Dakle, značaj R je određen ne samo njegovom vrijednošću, već i omjerom između broja eksperimenata i broja koeficijenata (parametara) modela. Doista, omjer korelacije za n=2 za jednostavan linearni model je 1 (kroz 2 točke na ravnini uvijek možete povući jednu ravnu liniju). Međutim, ako su eksperimentalni podaci slučajne varijable, takvoj vrijednosti R treba vjerovati s velikom pažnjom. Obično, kako bi se dobila značajna R i pouzdana regresija, nastoji se osigurati da broj eksperimenata značajno premašuje broj koeficijenata modela (n>k).

Da biste izgradili model linearne regresije, morate:

1) pripremite popis od n redaka i m stupaca koji sadrže eksperimentalne podatke (stupac koji sadrži izlaznu vrijednost Y mora biti prvi ili zadnji na popisu); na primjer, uzmimo podatke iz prethodnog zadatka, dodajući stupac pod nazivom "broj razdoblja", numerirajući brojeve razdoblja od 1 do 12. (to će biti vrijednosti x)

2) idite na izbornik Podaci/Analiza podataka/Regresija

Ako nedostaje stavka "Analiza podataka" u izborniku "Alati", trebali biste ići na stavku "Dodaci" u istom izborniku i potvrditi okvir "Paket analize".

3) u dijaloškom okviru "Regresija" postavite:

ulazni interval Y;

ulazni interval X;

izlazni interval - gornja lijeva ćelija intervala u koji će se smjestiti rezultati izračuna (preporuča se staviti na novi radni list);

4) kliknite "U redu" i analizirajte rezultate.

Ako neka fizička veličina ovisi o drugoj veličini, tada se ta ovisnost može istražiti mjerenjem y na različitim vrijednostima x. Kao rezultat mjerenja dobiva se niz vrijednosti:

x 1, x 2, ..., x i, ..., x n;

y 1 , y 2 , ..., y i , ... , y n .

Na temelju podataka takvog eksperimenta moguće je nacrtati ovisnost y = ƒ(x). Dobivena krivulja omogućuje prosuđivanje oblika funkcije ƒ(x). Međutim, konstantni koeficijenti koji ulaze u ovu funkciju ostaju nepoznati. Mogu se odrediti metodom najmanjih kvadrata. Eksperimentalne točke u pravilu ne leže točno na krivulji. Metoda najmanjih kvadrata zahtijeva da zbroj kvadrata odstupanja eksperimentalnih točaka od krivulje, tj. 2 je bio najmanji.

U praksi se ova metoda najčešće (i najjednostavnije) koristi u slučaju linearnog odnosa, tj. Kada

y=kx ili y = a + bx.

Linearna ovisnost vrlo je raširena u fizici. Pa čak i kada je ovisnost nelinearna, obično se pokušava izgraditi grafikon na takav način da se dobije ravna linija. Na primjer, ako se pretpostavi da je indeks loma stakla n povezan s valnom duljinom λ svjetlosnog vala relacijom n = a + b/λ 2 , tada se ovisnost n o λ -2 prikazuje na grafu .

Razmotrite ovisnost y=kx(ravna linija koja prolazi kroz ishodište). Sastavimo vrijednost φ zbroj kvadrata odstupanja naših točaka od ravne crte

Vrijednost φ je uvijek pozitivna i ispada da je to manja što su naše točke bliže pravoj liniji. Metoda najmanjih kvadrata kaže da za k treba izabrati takvu vrijednost pri kojoj φ ima minimum


ili
(19)

Izračun pokazuje da je srednja kvadratna pogreška u određivanju vrijednosti k jednaka

, (20)
gdje je n broj dimenzija.

Razmotrimo sada nešto teži slučaj, kada točke moraju zadovoljiti formulu y = a + bx(ravna crta koja ne prolazi kroz ishodište).

Zadatak je pronaći najbolje vrijednosti a i b iz zadanog skupa vrijednosti x i , y i .

Opet sastavljamo kvadratni oblik φ jednak zbroju kvadrata odstupanja točaka x i , y i od pravca

i pronaći vrijednosti a i b za koje φ ima minimum

;

.

.

Zajedničko rješavanje ovih jednadžbi daje

(21)

Srednje kvadratne pogreške određivanja a i b su jednake

(23)

.  (24)

Prilikom obrade rezultata mjerenja ovom metodom prikladno je sve podatke sažeti u tablicu u kojoj su prethodno izračunati svi iznosi uključeni u formule (19)(24). Oblici ovih tablica prikazani su u primjerima u nastavku.

Primjer 1 Proučavana je osnovna jednadžba dinamike rotacijskog gibanja ε = M/J (pravac koji prolazi kroz ishodište). Za različite vrijednosti momenta M izmjereno je kutno ubrzanje ε određenog tijela. Potrebno je odrediti moment tromosti ovog tijela. U drugom i trećem stupcu navedeni su rezultati mjerenja momenta sile i kutne akceleracije tablice 5.

Tablica 5
n M, N m ε, s-1 M2 M ε ε - kM (ε - kM) 2
1 1.44 0.52 2.0736 0.7488 0.039432 0.001555
2 3.12 1.06 9.7344 3.3072 0.018768 0.000352
3 4.59 1.45 21.0681 6.6555 -0.08181 0.006693
4 5.90 1.92 34.81 11.328 -0.049 0.002401
5 7.45 2.56 55.5025 19.072 0.073725 0.005435
– – 123.1886 41.1115 – 0.016436

Formulom (19) određujemo:

.

Za određivanje srednje kvadratne pogreške koristimo formulu (20)

0.005775kg-1 · m -2 .

Po formuli (18) imamo

; .

SJ = (2,996 0,005775)/0,3337 = 0,05185 kg m 2.

S obzirom na pouzdanost P = 0,95 , prema tablici Studentovih koeficijenata za n = 5 nalazimo t = 2,78 i određujemo apsolutnu pogrešku ΔJ = 2,78 0,05185 = 0,1441 ≈ 0,2 kg m 2.

Rezultate zapisujemo u obliku:

J = (3,0 ± 0,2) kg m 2;


Primjer 2 Metodom najmanjih kvadrata izračunavamo temperaturni koeficijent otpora metala. Otpor ovisi o temperaturi prema linearnom zakonu

R t \u003d R 0 (1 + α t °) \u003d R 0 + R 0 α t °.

Slobodni član određuje otpor R 0 pri temperaturi od 0 °C, a kutni koeficijent je umnožak temperaturnog koeficijenta α i otpora R 0 .

Rezultati mjerenja i proračuna dati su u tablici ( vidi tablicu 6).

Tablica 6
n t°, s r, Ohm t-¯t (t-¯t) 2 (t-¯t)r r-bt-a (r - bt - a) 2,10 -6
1 23 1.242 -62.8333 3948.028 -78.039 0.007673 58.8722
2 59 1.326 -26.8333 720.0278 -35.581 -0.00353 12.4959
3 84 1.386 -1.83333 3.361111 -2.541 -0.00965 93.1506
4 96 1.417 10.16667 103.3611 14.40617 -0.01039 107.898
5 120 1.512 34.16667 1167.361 51.66 0.021141 446.932
6 133 1.520 47.16667 2224.694 71.69333 -0.00524 27.4556
515 8.403 – 8166.833 21.5985 – 746.804
∑/n 85.83333 1.4005 – – – – –

Formulama (21), (22) određujemo

R 0 = ¯ R- α R 0 ¯ t = 1,4005 - 0,002645 85,83333 = 1,1735 Ohm.

Pronađimo grešku u definiciji α. Kako je , onda po formuli (18) imamo:

.

Koristeći formule (23), (24) imamo

;

0.014126 Ohm.

S obzirom na pouzdanost P = 0,95, prema tablici Studentovih koeficijenata za n = 6 nalazimo t = 2,57 i određujemo apsolutnu pogrešku Δα = 2,57 0,000132 = 0,000338 stupanj -1.

α = (23 ± 4) 10 -4 tuča-1 pri P = 0,95.


Primjer 3 Potrebno je odrediti polumjer zakrivljenosti leće iz Newtonovih prstenova. Izmjereni su polumjeri Newtonovih prstenova r m i određeni su brojevi tih prstenova m. Polumjeri Newtonovih prstenova povezani su s polumjerom zakrivljenosti leće R i brojem prstena jednadžbom

r 2 m = mλR - 2d 0 R,

gdje je d 0 debljina razmaka između leće i planparalelne ploče (ili deformacija leće),

λ je valna duljina upadne svjetlosti.

λ = (600 ± 6) nm;
r 2 m = y;
m = x;
λR = b;
-2d 0 R = a,

tada će jednadžba poprimiti oblik y = a + bx.

.

Upisuju se rezultati mjerenja i proračuna tablica 7.

Tablica 7
n x = m y \u003d r 2, 10 -2 mm 2 m-¯m (m-¯m) 2 (m-¯m)y y-bx-a, 10-4 (y - bx - a) 2, 10 -6
1 1 6.101 -2.5 6.25 -0.152525 12.01 1.44229
2 2 11.834 -1.5 2.25 -0.17751 -9.6 0.930766
3 3 17.808 -0.5 0.25 -0.08904 -7.2 0.519086
4 4 23.814 0.5 0.25 0.11907 -1.6 0.0243955
5 5 29.812 1.5 2.25 0.44718 3.28 0.107646
6 6 35.760 2.5 6.25 0.894 3.12 0.0975819
21 125.129 – 17.5 1.041175 – 3.12176
∑/n 3.5 20.8548333 – – – – –

Odabir vrste regresijske funkcije, tj. tip razmatranog modela ovisnosti Y o X (ili X o Y), na primjer, linearni model y x = a + bx, potrebno je odrediti specifične vrijednosti koeficijenata modela.

Za različite vrijednosti a i b moguće je konstruirati beskonačan broj ovisnosti oblika y x =a+bx, tj. na koordinatnoj ravnini postoji beskonačan broj pravaca, ali nam je potrebna takva ovisnost da na najbolji način odgovara promatranim vrijednostima. Time se problem svodi na odabir najboljih koeficijenata.

Tražimo linearnu funkciju a + bx, temeljenu samo na određenom broju dostupnih promatranja. Kako bismo pronašli funkciju koja najbolje odgovara promatranim vrijednostima, koristimo se metodom najmanjih kvadrata.

Označimo: Y i - vrijednost izračunata jednadžbom Y i =a+bx i . y i - izmjerena vrijednost, ε i =y i -Y i - razlika između izmjerene i izračunate vrijednosti, ε i =y i -a-bx i .

Metoda najmanjih kvadrata zahtijeva da ε i , razlika između izmjerenog y i i vrijednosti Y i izračunate iz jednadžbe, bude minimalna. Stoga nalazimo koeficijente a i b tako da zbroj kvadrata odstupanja promatranih vrijednosti od vrijednosti na ravnoj regresijskoj liniji bude najmanji:

Istražujući ovu funkciju argumenata a uz pomoć derivacija do ekstrema, možemo dokazati da funkcija poprima minimalnu vrijednost ako su koeficijenti a i b rješenja sustava:

(2)

Ako obje strane normalnih jednadžbi podijelimo s n, dobivamo:

S obzirom na to (3)

Dobiti , odavde, zamjenom vrijednosti a u prvoj jednadžbi, dobivamo:

U ovom slučaju b se naziva koeficijent regresije; a naziva se slobodnim članom regresijske jednadžbe i izračunava se po formuli:

Rezultirajuća ravna linija je procjena za teoretsku regresijsku liniju. Imamo:

Tako, je jednadžba linearne regresije.

Regresija može biti izravna (b>0) i inverzna (b Primjer 1. Rezultati mjerenja vrijednosti X i Y dati su u tablici:

x i -2 0 1 2 4
y i 0.5 1 1.5 2 3

Uz pretpostavku da postoji linearni odnos između X i Y y=a+bx, odredite koeficijente a i b koristeći metodu najmanjih kvadrata.

Riješenje. Ovdje je n=5
x i =-2+0+1+2+4=5;
x i 2 =4+0+1+4+16=25
x i y i =-2 0,5+0 1+1 1,5+2 2+4 3=16,5
y i =0,5+1+1,5+2+3=8

a normalni sustav (2) ima oblik

Rješavanjem ovog sustava dobivamo: b=0,425, a=1,175. Prema tome y=1,175+0,425x.

Primjer 2. Postoji uzorak od 10 promatranja ekonomskih pokazatelja (X) i (Y).

x i 180 172 173 169 175 170 179 170 167 174
y i 186 180 176 171 182 166 182 172 169 177

Potrebno je pronaći oglednu regresijsku jednadžbu Y na X. Konstruirajte oglednu regresijsku liniju Y na X.

Riješenje. 1. Razvrstajmo podatke po vrijednostima x i i y i . Dobivamo novu tablicu:

x i 167 169 170 170 172 173 174 175 179 180
y i 169 171 166 172 180 176 177 182 182 186

Radi pojednostavljenja izračuna sastavit ćemo proračunsku tablicu u koju ćemo unijeti potrebne numeričke vrijednosti.

x i y i x i 2 x i y i
167 169 27889 28223
169 171 28561 28899
170 166 28900 28220
170 172 28900 29240
172 180 29584 30960
173 176 29929 30448
174 177 30276 30798
175 182 30625 31850
179 182 32041 32578
180 186 32400 33480
∑x i =1729 ∑y i =1761 ∑x i 2 299105 ∑x i y i =304696
x=172,9 y=176.1 x i 2 = 29910,5 xy=30469.6

Prema formuli (4) izračunavamo koeficijent regresije

i formulom (5)

Dakle, jednadžba uzorka regresije izgleda kao y=-59,34+1,3804x.
Nacrtajmo točke (x i ; y i) na koordinatnu ravninu i označimo regresijsku liniju.


Slika 4

Slika 4 prikazuje kako se promatrane vrijednosti nalaze u odnosu na regresijsku liniju. Da bismo numerički procijenili odstupanja y i od Y i , gdje su y i promatrane vrijednosti, a Y i vrijednosti određene regresijom, napravit ćemo tablicu:

x i y i Y i Y i -y i
167 169 168.055 -0.945
169 171 170.778 -0.222
170 166 172.140 6.140
170 172 172.140 0.140
172 180 174.863 -5.137
173 176 176.225 0.225
174 177 177.587 0.587
175 182 178.949 -3.051
179 182 184.395 2.395
180 186 185.757 -0.243

Vrijednosti Y i izračunavaju se prema regresijskoj jednadžbi.

Primjetno odstupanje nekih promatranih vrijednosti od regresijske linije objašnjava se malim brojem promatranja. Pri proučavanju stupnja linearne ovisnosti Y o X uzima se u obzir broj opažanja. Snaga ovisnosti određena je vrijednošću koeficijenta korelacije.

Problem je pronaći koeficijente linearne ovisnosti za koje je funkcija dviju varijabli A I b uzima najmanju vrijednost. Odnosno s obzirom na podatke A I b zbroj kvadrata odstupanja eksperimentalnih podataka od nađene ravne linije bit će najmanji. Ovo je cijela poanta metode najmanjih kvadrata.

Dakle, rješenje primjera se svodi na pronalaženje ekstremuma funkcije dviju varijabli.

Izvođenje formula za određivanje koeficijenata. Sastavlja se i rješava sustav dviju jednadžbi s dvije nepoznanice. Određivanje parcijalnih izvoda funkcija po varijablama A I b, te izvodnice izjednačujemo s nulom.

Dobiveni sustav jednadžbi rješavamo bilo kojom metodom (npr. metodom supstitucije ili Cramer metodom) i dobivamo formule za pronalaženje koeficijenata metodom najmanjih kvadrata (LSM).

S podacima A I b funkcija uzima najmanju vrijednost.

To je cijela metoda najmanjih kvadrata. Formula za pronalaženje parametra a sadrži zbrojeve , , , i parametar n- količina eksperimentalnih podataka. Vrijednosti ovih zbrojeva preporučuje se zasebno izračunati. Koeficijent b pronađeno nakon proračuna a.

Glavno područje primjene takvih polinoma je obrada eksperimentalnih podataka (konstrukcija empirijskih formula). Činjenica je da će interpolacijski polinom konstruiran iz vrijednosti funkcije dobivene uz pomoć eksperimenta biti pod jakim utjecajem "eksperimentalnog šuma", štoviše, tijekom interpolacije čvorovi interpolacije ne mogu se ponoviti, tj. ne možete koristiti rezultate ponovljenih eksperimenata pod istim uvjetima. Srednjekvadratni polinom izglađuje šum i omogućuje korištenje rezultata više eksperimenata.

Numerička integracija i diferencijacija. Primjer.

Numerička integracija- izračunavanje vrijednosti određenog integrala (u pravilu, približno). Numerička integracija se shvaća kao skup numeričkih metoda za pronalaženje vrijednosti određenog integrala.

Numeričko razlikovanje– skup metoda za izračunavanje vrijednosti derivacije diskretno zadane funkcije.

Integracija

Formulacija problema. Matematička formulacija problema: potrebno je pronaći vrijednost određenog integrala

gdje su a, b konačni, f(x) je kontinuiran na [a, b].

Pri rješavanju praktičnih problema često se događa da je integral nezgodno ili nemoguće uzeti analitički: možda se ne izražava u elementarnim funkcijama, integrand se može dati u obliku tablice itd. U takvim slučajevima koriste se metode numeričke integracije. koristi se. Metode numeričke integracije koriste zamjenu površine krivocrtnog trapeza konačnim zbrojem površina jednostavnijih geometrijskih oblika koji se mogu točno izračunati. U tom smislu se govori o upotrebi kvadraturnih formula.

Većina metoda koristi prikaz integrala kao konačnog zbroja (kvadraturna formula):

Kvadraturne formule temelje se na ideji zamjene grafa integranda na integracijskom intervalu funkcijama jednostavnijeg oblika, koje se mogu lako analitički integrirati i na taj način lako izračunati. Najjednostavniji zadatak konstruiranja kvadraturnih formula realizira se za polinomske matematičke modele.

Mogu se razlikovati tri skupine metoda:

1. Metoda s podjelom segmenta integracije na jednake intervale. Podjela na intervale radi se unaprijed, obično se intervali biraju jednaki (kako bi se lakše izračunala funkcija na krajevima intervala). Izračunati površine i zbrojiti ih (metoda pravokutnika, trapeza, Simpson).

2. Metode s particioniranjem segmenta integracije posebnim točkama (Gaussova metoda).

3. Izračunavanje integrala pomoću slučajnih brojeva (Monte Carlo metoda).

Metoda pravokutnika. Neka je funkcija (crtež) numerički integrirana na segmentu . Isječak podijelimo na N jednakih intervala. Površina svakog od N krivocrtnih trapeza može se zamijeniti površinom pravokutnika.

Širina svih pravokutnika je ista i jednaka:

Kao izbor visine pravokutnika, možete odabrati vrijednost funkcije na lijevom rubu. U ovom slučaju, visina prvog pravokutnika će biti f(a), drugog će biti f(x 1),…, N-f(N-1).

Ako uzmemo vrijednost funkcije na desnom rubu kao izbor visine pravokutnika, tada će u ovom slučaju visina prvog pravokutnika biti f (x 1), drugog - f (x 2), . .., N - f (x N).

Kao što se vidi, u ovom slučaju jedna od formula daje aproksimaciju integrala s viškom, a druga s manjkom. Postoji još jedan način - koristiti vrijednost funkcije u sredini segmenta integracije za aproksimaciju:

Procjena apsolutne pogreške metode pravokutnika (sredina)

Procjena apsolutne pogreške metode lijevog i desnog pravokutnika.

Primjer. Izračunajte za cijeli interval i podijelite interval na četiri dijela

Riješenje. Analitički izračun ovog integrala daje I=arctg(1)–arctg(0)=0,7853981634. U našem slučaju:

1) h = 1; xo = 0; x1 = 1;

2) h = 0,25 (1/4); x0 = 0; xl = 0,25; x2 = 0,5; x3 = 0,75; x4 = 1;

Računamo metodom lijevih pravokutnika:

Računamo metodom pravokutnika:

Izračunajte metodom prosječnih pravokutnika:

Trapezoidna metoda. Korištenje polinoma prvog stupnja za interpolaciju (pravac povučen kroz dvije točke) dovodi do formule trapeza. Krajevi segmenta integracije uzimaju se kao interpolacijski čvorovi. Dakle, krivolinijski trapez zamijenjen je običnim trapezom, čija se površina može pronaći kao umnožak polovice zbroja baza i visine

U slučaju N segmenata integracije za sve čvorove, osim za ekstremne točke segmenta, vrijednost funkcije će biti uključena u ukupni zbroj dva puta (budući da susjedni trapezi imaju jednu zajedničku stranicu)

Formula trapeza može se dobiti uzimanjem polovice zbroja formula pravokutnika duž desnog i lijevog ruba segmenta:

Provjera stabilnosti otopine. U pravilu, što je duljina svakog intervala kraća, tj. što je veći broj tih intervala, to je manja razlika između približne i točne vrijednosti integrala. Ovo vrijedi za većinu funkcija. U metodi trapeza pogreška u izračunavanju integrala ϭ približno je proporcionalna kvadratu koraka integracije (ϭ ~ h 2). Dakle, da bi se izračunao integral određene funkcije u granicama a, b, potrebno je podijelite segment na N 0 intervala i pronađite zbroj površina trapeza. Zatim morate povećati broj intervala N 1, ponovno izračunati zbroj trapeza i usporediti dobivenu vrijednost s prethodnim rezultatom. Ovo treba ponavljati do (N i) dok se ne postigne navedena točnost rezultata (kriterij konvergencije).

Za metode pravokutnika i trapeza, obično u svakom koraku iteracije, broj intervala se povećava za faktor 2 (N i +1 =2N i).

Kriterij konvergencije:

Glavna prednost trapezoidnog pravila je njegova jednostavnost. Međutim, ako integracija zahtijeva visoku preciznost, ova metoda može zahtijevati previše ponavljanja.

Apsolutna pogreška trapezne metode ocijenjeno kao
.

Primjer. Izračunajte približno određeni integral pomoću formule trapeza.

a) Dijeljenje segmenta integracije na 3 dijela.
b) Dijeljenje segmenta integracije na 5 dijelova.

Riješenje:
a) Po uvjetu, segment integracije mora biti podijeljen na 3 dijela, tj.
Izračunajte duljinu svakog segmenta pregrade: .

Dakle, opća formula trapeza svedena je na ugodnu veličinu:

Konačno:

Podsjećam vas da je dobivena vrijednost približna vrijednost površine.

b) Isječak integracije podijelimo na 5 jednakih dijelova, tj. povećanjem broja segmenata povećavamo točnost izračuna.

Ako je , tada formula trapeza ima sljedeći oblik:

Pronađimo korak particioniranja:
, odnosno duljina svakog međusegmenta je 0,6.

Kada završite zadatak, prikladno je izraditi sve izračune pomoću tablice izračuna:

U prvom redu pišemo "brojač"

Kao rezultat:

Pa, stvarno postoji pojašnjenje, i to ozbiljno!
Ako za 3 segmenta pregrade, onda za 5 segmenata. Ako uzmete još veći segment => bit će još precizniji.

Simpsonova formula. Formula trapeza daje rezultat koji jako ovisi o veličini koraka h, što utječe na točnost izračuna određenog integrala, posebno u slučajevima kada je funkcija nemonotona. Može se pretpostaviti povećanje točnosti izračuna ako umjesto segmenata ravnih linija koji zamjenjuju krivuljaste fragmente grafa funkcije f(x), koristimo, na primjer, fragmente parabola danih kroz tri susjedne točke grafa . Slična geometrijska interpretacija leži u osnovi Simpsonove metode za izračunavanje određenog integrala. Cijeli integracijski interval a,b podijeljen je na N segmenata, duljina segmenta će također biti jednaka h=(b-a)/N.

Simpsonova formula je:

preostali izraz

S povećanjem duljine segmenata, točnost formule se smanjuje, stoga se za povećanje točnosti koristi kompozitna Simpsonova formula. Cijeli integracijski interval je podijeljen na paran broj identičnih segmenata N, duljina segmenta će također biti jednaka h=(b-a)/N. Složena Simpsonova formula je:

U formuli, izrazi u zagradama su zbrojevi vrijednosti integranda, odnosno na krajevima neparnih i parnih unutarnjih segmenata.

Ostatak Simpsonove formule već je proporcionalan četvrtoj potenciji koraka:

Primjer: Izračunajte integral koristeći Simpsonovo pravilo. (Točno rješenje - 0,2)

Gaussova metoda

Kvadraturna formula Gaussa. Osnovni princip kvadraturnih formula druge vrste vidljiv je sa slike 1.12: potrebno je postaviti točke na takav način x 0 i x 1 unutar segmenta [ a;b] tako da površine "trokuta" ukupno budu jednake površinama "segmenta". Kada se koristi Gaussova formula, početni segment [ a;b] se promjenom varijable svodi na interval [-1;1]. x na

0.5∙(ba)∙t+ 0.5∙(b + a).

Zatim , Gdje .

Ova zamjena je moguća ako a I b su konačne, a funkcija f(x) kontinuirano je na [ a;b]. Gaussova formula za n bodova x i, ja=0,1,..,n-1 unutar segmenta [ a;b]:

, (1.27)

Gdje t i I Ai za razne n dati su u referentnim knjigama. Na primjer, kada n=2 A 0 =A 1=1; na n=3: t 0 =t 2" 0,775, t 1 =0, A 0 =A 2" 0,555, A 1" 0,889.

Kvadraturna formula Gaussa

dobiven s težinskom funkcijom jednakom jedan p(x)= 1 i čvorovi x i, koji su korijeni Legendreovih polinoma

Izgledi Ai lako izračunati formulama

ja=0,1,2,...n.

Vrijednosti čvorova i koeficijenata za n=2,3,4,5 date su u tablici

Narudžba Čvorovi Izgledi
n=2 x 1=0 x 0 =-x2=0.7745966692 A 1=8/9 A 0 = A 2=5/9
n=3 x 2 =-x 1=0.3399810436 x 3 =-x0=0.8611363116 A 1 = A 2=0.6521451549 A 0 = A 3=0.6521451549
n=4 x 2 = 0 x 3 = -x 1 = 0.5384693101 x 4 =-x 0 =0.9061798459 A 0 =0.568888899 A 3 =A 1 =0.4786286705 A 0 =A 4 =0.2869268851
n=5 x 5 = -x 0 =0.9324695142 x 4 = -x 1 =0.6612093865 x 3 = -x 2 =0.2386191861 A 5 =A 0 =0.1713244924 A 4 =A 1 =0.3607615730 A 3 =A 2 =0.4679139346

Primjer. Izračunajte vrijednost pomoću Gaussove formule za n=2:

Točna vrijednost: .

Algoritam za izračunavanje integrala prema Gaussovoj formuli ne predviđa udvostručenje broja mikrosegmenata, već povećanje broja ordinata za 1 i usporedbu dobivenih vrijednosti integrala. Prednost Gaussove formule je velika točnost s relativno malim brojem ordinata. Nedostaci: nezgodno za ručne izračune; moraju biti pohranjeni u memoriji računala t i, Ai za razne n.

Pogreška Gaussove kvadraturne formule na segmentu bit će u isto vrijeme Za formulu ostatka će biti gdje je koeficijent α N brzo se smanjuje s rastom N. Ovdje

Gaussove formule daju visoku točnost već s malim brojem čvorova (od 4 do 10).U ovom slučaju, u praktičnim proračunima, broj čvorova kreće se od nekoliko stotina do nekoliko tisuća. Također napominjemo da su težine Gaussovih kvadratura uvijek pozitivne, što osigurava stabilnost algoritma za izračunavanje zbrojeva

Gore