Գծային ռեգրեսիա. Օգտագործելով նվազագույն քառակուսիների մեթոդը (LSM): Փորձարարական տվյալների մոտարկում. Նվազագույն քառակուսիների մեթոդ Նվազագույն քառակուսիների մեթոդը 3 փոփոխականի դեպքում

Որն ամենալայն կիրառությունն է գտնում գիտության և պրակտիկայի տարբեր ոլորտներում: Դա կարող է լինել ֆիզիկա, քիմիա, կենսաբանություն, տնտեսագիտություն, սոցիոլոգիա, հոգեբանություն և այլն, և այլն։ Ճակատագրի կամքով ես հաճախ ստիպված եմ զբաղվել տնտեսությամբ, և, հետևաբար, այսօր ես ձեզ համար տոմս կկազմակերպեմ դեպի զարմանալի երկիր, որը կոչվում է. Էկոնոմետրիկա=) … Ինչպե՞ս չես ուզում դա: Այնտեղ շատ լավ է, դուք պարզապես պետք է որոշեք: …Բայց այն, ինչ դուք, հավանաբար, անպայման ցանկանում եք, սովորելն է, թե ինչպես լուծել խնդիրները նվազագույն քառակուսիները. Եվ հատկապես ջանասեր ընթերցողները կսովորեն դրանք լուծել ոչ միայն ճշգրիտ, այլև ՇԱՏ արագ ;-) Բայց նախ. խնդրի ընդհանուր հայտարարություն+ հարակից օրինակ.

Թող ցուցիչները ուսումնասիրվեն ինչ-որ առարկայական ոլորտում, որոնք ունեն քանակական արտահայտություն: Միեւնույն ժամանակ, բոլոր հիմքերը կան ենթադրելու, որ ցուցանիշը կախված է ցուցանիշից։ Այս ենթադրությունը կարող է լինել և՛ գիտական ​​վարկած, և՛ հիմնված տարրական ողջախոհության վրա: Այնուամենայնիվ, եկեք մի կողմ թողնենք գիտությունը և ուսումնասիրենք ավելի ախորժելի ոլորտները, մասնավորապես, մթերային խանութները: Նշել հետևյալով.

– մթերային խանութի մանրածախ տարածք, քմ.
- մթերային խանութի տարեկան շրջանառությունը, միլիոն ռուբլի:

Միանգամայն պարզ է, որ որքան մեծ է խանութի տարածքը, այնքան մեծ է դրա շրջանառությունը շատ դեպքերում։

Ենթադրենք, որ դիտարկումներ / փորձեր / հաշվարկներ / դափով պարելուց հետո մենք մեր տրամադրության տակ ունենք թվային տվյալներ.

Մթերային խանութների դեպքում, կարծում եմ, ամեն ինչ պարզ է. - սա 1-ին խանութի տարածքն է, - նրա տարեկան շրջանառությունը, - 2-րդ խանութի տարածքը, - տարեկան շրջանառությունը և այլն: Ի դեպ, ամենևին էլ անհրաժեշտ չէ դասակարգված նյութերին հասանելիություն ունենալ. շրջանառության բավականին ճշգրիտ գնահատում կարելի է ստանալ՝ օգտագործելով. մաթեմատիկական վիճակագրություն. Այնուամենայնիվ, մի շեղվեք, առևտրային լրտեսության ընթացքն արդեն վճարված է =)

Աղյուսակային տվյալները կարող են գրվել նաև կետերի տեսքով և պատկերվել մեզ համար սովորական ձևով։ Դեկարտյան համակարգ .

Պատասխանենք մի կարևոր հարցի. քանի՞ միավոր է անհրաժեշտ որակական ուսումնասիրության համար:

Որքան մեծ է, այնքան լավ: Նվազագույն թույլատրելի հավաքածուն բաղկացած է 5-6 միավորից։ Բացի այդ, փոքր քանակությամբ տվյալների դեպքում «աննորմալ» արդյունքները չպետք է ներառվեն ընտրանքում: Այսպիսով, օրինակ, փոքր էլիտար խանութը կարող է օգնել ավելի մեծ չափերի, քան «իրենց գործընկերները», դրանով իսկ խեղաթյուրելով ընդհանուր օրինաչափությունը, որը պետք է գտնել:

Եթե ​​դա բավականին պարզ է, մենք պետք է ընտրենք ֆունկցիա, ժամանակացույցըորը հնարավորինս մոտ է անցնում կետերին . Նման ֆունկցիան կոչվում է մոտավոր (մոտավորություն - մոտավորություն)կամ տեսական գործառույթ . Ընդհանրապես, այստեղ անմիջապես հայտնվում է ակնհայտ «հավակնորդ»՝ բարձր աստիճանի բազմանդամ, որի գրաֆիկն անցնում է ԲՈԼՈՐ կետերով։ Բայց այս տարբերակը բարդ է և հաճախ պարզապես սխալ: (քանի որ գծապատկերը մշտապես «քամու» է լինելու և վատ է արտացոլում հիմնական միտումը).

Այսպիսով, ցանկալի գործառույթը պետք է լինի բավականաչափ պարզ և միևնույն ժամանակ համարժեքորեն արտացոլի կախվածությունը: Ինչպես կարող եք կռահել, նման գործառույթներ գտնելու մեթոդներից մեկը կոչվում է նվազագույն քառակուսիները. Նախ՝ ընդհանուր առմամբ վերլուծենք դրա էությունը։ Թող որոշ ֆունկցիա մոտավորի փորձարարական տվյալներին.


Ինչպե՞ս գնահատել այս մոտավորության ճշգրտությունը: Հաշվարկենք նաև փորձարարական և ֆունկցիոնալ արժեքների տարբերությունները (շեղումները): (մենք ուսումնասիրում ենք նկարը). Առաջին միտքը, որ գալիս է գլխի, դա է գնահատել, թե որքան մեծ է գումարը, բայց խնդիրն այն է, որ տարբերությունները կարող են բացասական լինել: (Օրինակ, ) և նման գումարման արդյունքում շեղումները կչեղարկեն միմյանց: Հետևաբար, որպես մոտարկման ճշգրտության գնահատում, ինքն իրեն առաջարկում է վերցնել գումարը մոդուլներշեղումներ:

կամ ծալովի տեսքով. (հանկարծ, ով չգիտի. գումարի պատկերակն է և օժանդակ փոփոխական է՝ «հաշվիչը», որը արժեքներ է վերցնում 1-ից մինչև ).

Փորձարարական կետերը տարբեր ֆունկցիաներով մոտավորելով՝ մենք կստանանք -ի տարբեր արժեքներ, և ակնհայտ է, որ որտեղ այս գումարը փոքր է, այդ ֆունկցիան ավելի ճշգրիտ է։

Նման մեթոդ գոյություն ունի և կոչվում է նվազագույն մոդուլի մեթոդ. Սակայն գործնականում այն ​​շատ ավելի լայն տարածում է գտել։ նվազագույն քառակուսի մեթոդ, որի դեպքում հնարավոր բացասական արժեքները վերացվում են ոչ թե մոդուլով, այլ շեղումները քառակուսու միջոցով.

, որից հետո ջանքերն ուղղվում են այնպիսի ֆունկցիայի ընտրությանը, որ քառակուսի շեղումների գումարը հնարավորինս փոքր էր: Փաստորեն, այստեղից էլ մեթոդի անվանումը։

Եվ հիմա մենք վերադառնում ենք մեկ այլ կարևոր կետի. ինչպես նշվեց վերևում, ընտրված գործառույթը պետք է լինի բավականին պարզ, բայց կան նաև շատ նման գործառույթներ. գծային , հիպերբոլիկ, էքսպոնենցիալ, լոգարիթմական, քառակուսի և այլն: Եվ, իհարկե, այստեղ կուզենայի անմիջապես «փոքրացնել գործունեության դաշտը»։ Ի՞նչ դասի գործառույթներ ընտրել հետազոտության համար: Պարզունակ, բայց արդյունավետ տեխնիկա.

- Միավորներ նկարելու ամենահեշտ ձևը գծագրի վրա և վերլուծել դրանց գտնվելու վայրը: Եթե ​​նրանք հակված են լինել ուղիղ գծի վրա, ապա դուք պետք է փնտրեք ուղիղ գծի հավասարում օպտիմալ արժեքներով և. Այլ կերպ ասած, խնդիր է դրված գտնել ՆՄԱՆ գործակիցներ, որպեսզի քառակուսի շեղումների գումարը լինի ամենափոքրը:

Եթե ​​կետերը գտնվում են, օրինակ, երկայնքով հիպերբոլիա, ապա պարզ է, որ գծային ֆունկցիան թույլ մոտավորություն կտա։ Այս դեպքում մենք փնտրում ենք հիպերբոլայի հավասարման առավել «բարենպաստ» գործակիցները - նրանք, որոնք տալիս են քառակուսիների նվազագույն գումարը .

Հիմա նկատեք, որ երկու դեպքում էլ խոսքը գնում է երկու փոփոխականների ֆունկցիաներ, որոնց փաստարկներն են որոնված կախվածության ընտրանքներ:

Եվ ըստ էության մեզ պետք է ստանդարտ խնդիր լուծել՝ գտնել երկու փոփոխականներից բաղկացած ֆունկցիայի նվազագույնը.

Հիշեք մեր օրինակը. ենթադրենք, որ «խանութի» կետերը հակված են ուղիղ գծի վրա, և կան բոլոր հիմքերը հավատալու դրա ներկայությանը. գծային կախվածությունշրջանառություն առևտրային տարածքից. Գտնենք «a» և «be» այնպիսի գործակիցներ, որ քառակուսի շեղումների գումարը. ամենափոքրն էր։ Ամեն ինչ, ինչպես միշտ, առաջինը 1-ին կարգի մասնակի ածանցյալներ. Համաձայն գծայինության կանոնԴուք կարող եք տարբերակել հենց գումարի պատկերակի տակ.

Եթե ​​ցանկանում եք օգտագործել այս տեղեկատվությունը շարադրանքի կամ կուրսային աշխատանքի համար, ես շատ շնորհակալ կլինեմ աղբյուրների ցանկի հղման համար, նման մանրամասն հաշվարկներ ոչ մի տեղ չեք գտնի.

Եկեք ստանդարտ համակարգ կազմենք.

Մենք յուրաքանչյուր հավասարում կրճատում ենք «երկու»-ով և, ի լրումն, «բաժանում» ենք գումարները.

Նշում ինքնուրույն վերլուծել, թե ինչու «a»-ն և «be»-ը կարող են դուրս հանվել գումարի պատկերակից: Ի դեպ, ֆորմալ առումով դա կարելի է անել գումարով

Եկեք համակարգը վերաշարադրենք «կիրառական» ձևով.

որից հետո սկսում է գծվել մեր խնդրի լուծման ալգորիթմը.

Գիտե՞նք արդյոք կետերի կոորդինատները։ Մենք գիտենք. Գումարներ կարո՞ղ ենք գտնել Հեշտությամբ. Մենք կազմում ենք ամենապարզը երկու անհայտով երկու գծային հավասարումների համակարգ(«ա» և «բեհ»): Մենք լուծում ենք համակարգը, օրինակ. Կրամերի մեթոդը, որի արդյունքում առաջանում է անշարժ կետ . Ստուգում բավարար պայման էքստրեմումի համար, մենք կարող ենք ստուգել, ​​որ այս պահին ֆունկցիան ճշգրիտ հասնում է նվազագույնը. Ստուգումը կապված է լրացուցիչ հաշվարկների հետ և հետևաբար մենք այն կթողնենք կուլիսներում: (անհրաժեշտության դեպքում, բացակայող շրջանակը կարելի է դիտել). Վերջնական եզրակացություն ենք անում.

Գործառույթ լավագույն միջոցը (առնվազն ցանկացած այլ գծային ֆունկցիայի համեմատ)մոտեցնում է փորձնական կետերը . Կոպիտ ասած, նրա գրաֆիկը հնարավորինս մոտ է անցնում այս կետերին։ Ավանդույթի համաձայն էկոնոմետրիկաստացված մոտավոր ֆունկցիան նույնպես կոչվում է զուգավորված գծային ռեգրեսիայի հավասարում .

Քննարկվող խնդիրը մեծ գործնական նշանակություն ունի։ Մեր օրինակի իրավիճակում հավասարումը թույլ է տալիս կանխատեսել, թե ինչպիսի շրջանառություն («yig»)կլինի վաճառվող տարածքի այս կամ այն ​​արժեքով խանութում («x» բառի այս կամ այն ​​իմաստը). Այո, արդյունքում ստացված կանխատեսումը կլինի միայն կանխատեսում, բայց շատ դեպքերում այն ​​բավականին ճշգրիտ կստացվի։

Ես կվերլուծեմ միայն մեկ խնդիր «իրական» թվերով, քանի որ դրանում դժվարություններ չկան. բոլոր հաշվարկները 7-8-րդ դասարանների դպրոցական ծրագրի մակարդակով են: Դեպքերի 95 տոկոսում ձեզանից կպահանջվի գտնել միայն գծային ֆունկցիա, բայց հոդվածի վերջում ես ցույց կտամ, որ ավելի դժվար չէ գտնել օպտիմալ հիպերբոլայի, աստիճանի և որոշ այլ ֆունկցիաների հավասարումները:

Փաստորեն, մնում է բաժանել խոստացված բարիքները, որպեսզի սովորեք, թե ինչպես լուծել նման օրինակները ոչ միայն ճշգրիտ, այլև արագ: Մենք ուշադիր ուսումնասիրում ենք ստանդարտը.

Առաջադրանք

Երկու ցուցանիշների փոխհարաբերությունների ուսումնասիրության արդյունքում ստացվել են թվերի հետևյալ զույգերը.

Օգտագործելով նվազագույն քառակուսիների մեթոդը, գտե՛ք գծային ֆունկցիան, որը լավագույնս մոտավոր է էմպիրիկին (փորձառու)տվյալները։ Կատարեք գծագիր, որի վրա դեկարտյան ուղղանկյուն կոորդինատային համակարգում գծեք փորձարարական կետեր և մոտավոր ֆունկցիայի գրաֆիկ . Գտե՛ք էմպիրիկ և տեսական արժեքների քառակուսի շեղումների գումարը: Պարզեք, արդյոք գործառույթն ավելի լավն է (նվազագույն քառակուսիների մեթոդի առումով)մոտավոր փորձարարական կետեր.

Նկատի ունեցեք, որ «x» արժեքները բնական արժեքներ են, և սա ունի բնորոշ իմաստալից նշանակություն, որի մասին ես կխոսեմ մի փոքր ուշ. բայց դրանք, իհարկե, կարող են լինել կոտորակային: Բացի այդ, կախված որոշակի առաջադրանքի բովանդակությունից, և՛ «X» և «G» արժեքները կարող են լինել ամբողջությամբ կամ մասամբ բացասական: Դե, մեզ «անդեմ» առաջադրանք է տրվել, և մենք սկսում ենք այն լուծում:

Որպես համակարգի լուծում մենք գտնում ենք օպտիմալ ֆունկցիայի գործակիցները.

Ավելի կոմպակտ նշման նպատակով «հաշվիչ» փոփոխականը կարելի է բաց թողնել, քանի որ արդեն պարզ է, որ գումարումն իրականացվում է 1-ից մինչև .

Ավելի հարմար է պահանջվող գումարները հաշվարկել աղյուսակային ձևով.


Հաշվարկները կարող են իրականացվել միկրոհաշվարկի վրա, բայց շատ ավելի լավ է օգտագործել Excel-ը `ինչպես ավելի արագ, այնպես էլ առանց սխալների; դիտեք կարճ տեսանյութ.

Այսպիսով, մենք ստանում ենք հետևյալը համակարգ:

Այստեղ դուք կարող եք բազմապատկել երկրորդ հավասարումը 3-ով և 1-ին հավասարումից 2-րդը հանել անդամով. Բայց սա բախտ է. գործնականում համակարգերը հաճախ օժտված չեն, և նման դեպքերում դա խնայում է Կրամերի մեթոդը:
, ուստի համակարգն ունի յուրահատուկ լուծում։

Եկեք ստուգում անենք։ Ես հասկանում եմ, որ չեմ ուզում, բայց ինչո՞ւ բաց թողնել սխալները, որտեղ դրանք բացարձակապես չես կարող բաց թողնել: Գտնված լուծումը փոխարինի՛ր համակարգի յուրաքանչյուր հավասարման ձախ կողմում.

Ստացվում են համապատասխան հավասարումների ճիշտ մասերը, ինչը նշանակում է, որ համակարգը ճիշտ է լուծված։

Այսպիսով, ցանկալի մոտավոր գործառույթը. – from բոլոր գծային ֆունկցիաներըփորձնական տվյալները լավագույնս մոտավոր են դրանով:

Ի տարբերություն ուղիղ խանութի շրջանառության կախվածությունն իր տարածքից, հայտնաբերված կախվածությունն է հակադարձ («Որքան շատ - այնքան քիչ» սկզբունքը), և այս փաստն անմիջապես բացահայտվում է բացասականով անկյունային գործակից. Գործառույթ տեղեկացնում է մեզ, որ որոշակի ցուցանիշի 1 միավորով աճի դեպքում կախված ցուցանիշի արժեքը նվազում է միջին 0,65 միավորով: Ինչպես ասում են՝ ինչքան թանկանում է հնդկաձավարը, այնքան քիչ է վաճառվում։

Մոտավոր գործառույթը գծագրելու համար մենք գտնում ենք նրա երկու արժեքները.

և կատարիր գծագիրը.


Կառուցված գիծը կոչվում է միտում գիծ (մասնավորապես, գծային միտումի գիծ, ​​այսինքն, ընդհանուր դեպքում, միտումը պարտադիր չէ, որ ուղիղ գիծ լինի). Բոլորին է հայտնի «լինել թրենդ» արտահայտությունը, և կարծում եմ, որ այս տերմինը լրացուցիչ մեկնաբանությունների կարիք չունի։

Հաշվիր քառակուսի շեղումների գումարը էմպիրիկ և տեսական արժեքների միջև։ Երկրաչափական առումով սա «կարմիր» հատվածների երկարությունների քառակուսիների գումարն է (որոնցից երկուսն այնքան փոքր են, որ նույնիսկ չես կարող տեսնել).

Եկեք ամփոփենք հաշվարկները աղյուսակում.


Դրանք կրկին կարող են իրականացվել ձեռքով, միայն թե 1-ին կետի համար օրինակ բերեմ.

բայց շատ ավելի արդյունավետ է անել արդեն հայտնի ձևը.

Կրկնենք. ո՞րն է արդյունքի իմաստըՍկսած բոլոր գծային ֆունկցիաներըֆունկցիան Ցուցանիշը ամենափոքրն է, այսինքն՝ լավագույն մոտարկումն է իր ընտանիքում։ Եվ այստեղ, ի դեպ, պատահական չէ խնդրի վերջնական հարցը՝ իսկ եթե առաջարկվող էքսպոնենցիալ ֆունկցիան ավելի լավ կլինի՞ մոտավորել փորձնական կետերը։

Գտնենք քառակուսի շեղումների համապատասխան գումարը՝ դրանք տարբերելու համար կնշանակեմ «էպսիլոն» տառով։ Տեխնիկան միանգամայն նույնն է.


Եվ կրկին 1-ին կետի յուրաքանչյուր հրդեհի հաշվարկի համար.

Excel-ում մենք օգտագործում ենք ստանդարտ գործառույթը ԺԱՄԱՆԱԿ (Շարահյուսությունը կարելի է գտնել Excel Help-ում).

Եզրակացություն:, ուստի էքսպոնենցիալ ֆունկցիան ուղիղ գծից ավելի վատ է մոտեցնում փորձարարական կետերին .

Բայց այստեղ պետք է նշել, որ ավելի վատն է դեռ չի նշանակում, ինչն է սխալ. Այժմ ես կառուցեցի այս էքսպոնենցիոնալ ֆունկցիայի գրաֆիկը, և այն նույնպես անցնում է կետերին մոտ - այնքան, որ առանց վերլուծական ուսումնասիրության դժվար է ասել, թե որ գործառույթն է ավելի ճշգրիտ։

Սա ավարտում է լուծումը, և ես վերադառնում եմ փաստարկի բնական արժեքների հարցին: Տարբեր ուսումնասիրություններում, որպես կանոն, տնտեսական կամ սոցիոլոգիական ամիսները, տարիները կամ այլ հավասար ժամանակային միջակայքերը համարակալվում են բնական «X»-ով։ Դիտարկենք, օրինակ, նման խնդիր.

Օրինակ.

Փոփոխականների արժեքների վերաբերյալ փորձարարական տվյալներ XԵվ ժամըտրված են աղյուսակում:

Դրանց հավասարեցման արդյունքում ֆունկցիան

Օգտագործելով նվազագույն քառակուսի մեթոդ, մոտավորեք այս տվյալները գծային կախվածությամբ y=ax+b(գտնել տարբերակներ ԱԵվ բ) Պարզեք, թե երկու տողերից որն է ավելի լավ (նվազագույն քառակուսիների մեթոդի իմաստով) հավասարեցնում է փորձարարական տվյալները: Կատարեք նկարչություն:

Նվազագույն քառակուսիների մեթոդի էությունը (LSM).

Խնդիրը գծային կախվածության գործակիցները գտնելն է, որոնց համար գործում է երկու փոփոխականի ֆունկցիա ԱԵվ բ վերցնում է ամենափոքր արժեքը: Այսինքն՝ հաշվի առնելով տվյալները ԱԵվ բԳտնված ուղիղ գծից փորձարարական տվյալների քառակուսի շեղումների գումարը կլինի ամենափոքրը: Սա նվազագույն քառակուսիների մեթոդի ամբողջ իմաստն է:

Այսպիսով, օրինակի լուծումը կրճատվում է երկու փոփոխականների ֆունկցիայի ծայրահեղությունը գտնելով։

Գործակիցներ գտնելու բանաձևերի ստացում.

Կազմվում և լուծվում է երկու անհայտ ունեցող երկու հավասարումների համակարգ: Գործառույթների մասնակի ածանցյալների հայտնաբերում ըստ փոփոխականների ԱԵվ բ, այս ածանցյալները հավասարեցնում ենք զրոյի։

Ստացված հավասարումների համակարգը լուծում ենք ցանկացած մեթոդով (օրինակ փոխարինման մեթոդկամ Կրամերի մեթոդը) և ստացեք գործակիցները գտնելու բանաձևեր՝ օգտագործելով նվազագույն քառակուսիների մեթոդը (LSM):

Տվյալներով ԱԵվ բֆունկցիան վերցնում է ամենափոքր արժեքը: Այս փաստի ապացույցը տրված է էջի վերջում գտնվող տեքստի տակ.

Դա նվազագույն քառակուսիների ամբողջ մեթոդն է: Պարամետրը գտնելու բանաձևը ապարունակում է ,,, և պարամետր գումարները n- փորձարարական տվյալների քանակը. Այս գումարների արժեքները խորհուրդ է տրվում հաշվարկել առանձին: Գործակից բհայտնաբերվել է հաշվարկից հետո ա.

Ժամանակն է հիշել բնօրինակ օրինակը:

Լուծում.

Մեր օրինակում n=5. Մենք լրացնում ենք աղյուսակը այն գումարների հաշվարկման հարմարության համար, որոնք ներառված են պահանջվող գործակիցների բանաձևերում:

Աղյուսակի չորրորդ շարքի արժեքները ստացվում են յուրաքանչյուր թվի համար 2-րդ շարքի արժեքները 3-րդ շարքի արժեքներով բազմապատկելով։ ես.

Աղյուսակի հինգերորդ շարքի արժեքները ստացվում են յուրաքանչյուր թվի համար 2-րդ շարքի արժեքները քառակուսելով. ես.

Աղյուսակի վերջին սյունակի արժեքները տողերի միջև եղած արժեքների գումարներն են:

Գործակիցները գտնելու համար օգտագործում ենք նվազագույն քառակուսիների մեթոդի բանաձևերը ԱԵվ բ. Մենք դրանցում փոխարինում ենք աղյուսակի վերջին սյունակից համապատասխան արժեքները.

Հետևաբար, y=0.165x+2.184ցանկալի մոտավոր ուղիղ գիծն է:

Մնում է պարզել, թե տողերից որն է y=0.165x+2.184կամ ավելի լավ է մոտենում սկզբնական տվյալներին, այսինքն՝ կատարել գնահատական՝ օգտագործելով նվազագույն քառակուսիների մեթոդը:

Նվազագույն քառակուսիների մեթոդի սխալի գնահատում.

Դա անելու համար դուք պետք է հաշվարկեք այս տողերից սկզբնական տվյալների քառակուսի շեղումների գումարները Եվ , ավելի փոքր արժեքը համապատասխանում է մի տողի, որն ավելի լավ է մոտենում սկզբնական տվյալներին նվազագույն քառակուսիների մեթոդով:

Քանի որ, ապա գիծը y=0.165x+2.184ավելի լավ է մոտեցնում սկզբնական տվյալներին:

Նվազագույն քառակուսիների մեթոդի գրաֆիկական նկարազարդում (LSM):

Ամեն ինչ հիանալի է թվում աղյուսակներում: Կարմիր գիծը գտնված գիծն է y=0.165x+2.184, կապույտ գիծն է , վարդագույն կետերը սկզբնական տվյալներն են։

Գործնականում տարբեր գործընթացներ մոդելավորելիս, մասնավորապես՝ տնտեսական, ֆիզիկական, տեխնիկական, սոցիալական, լայնորեն կիրառվում է որոշ ֆիքսված կետերում դրանց հայտնի արժեքներից ֆունկցիաների մոտավոր արժեքների հաշվարկման այս կամ այն ​​մեթոդը:

Այս տեսակի գործառույթների մոտարկման խնդիրներ հաճախ են առաջանում.

    փորձի արդյունքում ստացված աղյուսակային տվյալների համաձայն ուսումնասիրվող գործընթացի բնորոշ քանակների արժեքները հաշվարկելու մոտավոր բանաձևեր կառուցելիս.

    թվային ինտեգրման, տարբերակման, դիֆերենցիալ հավասարումների լուծման և այլն;

    եթե անհրաժեշտ է հաշվարկել գործառույթների արժեքները դիտարկվող միջակայքի միջանկյալ կետերում.

    դիտարկվող միջակայքից դուրս գործընթացի բնորոշ մեծությունների արժեքները որոշելիս, մասնավորապես, կանխատեսելիս.

Եթե ​​աղյուսակով սահմանված որոշակի գործընթաց մոդելավորելու համար կառուցվում է մի ֆունկցիա, որը մոտավորապես նկարագրում է այս գործընթացը՝ հիմնվելով նվազագույն քառակուսիների մեթոդի վրա, այն կկոչվի մոտավոր ֆունկցիա (ռեգեսիա), և ինքնին մոտավոր գործառույթներ կառուցելու առաջադրանքը կկատարվի: լինել մոտավոր խնդիր:

Այս հոդվածում քննարկվում են MS Excel փաթեթի հնարավորությունները նման խնդիրների լուծման համար, բացի այդ, տրված են աղյուսակային տրված գործառույթների համար ռեգրեսիաների կառուցման (ստեղծման) մեթոդներ և տեխնիկա (որը ռեգրեսիոն վերլուծության հիմքն է):

Excel-ում ռեգրեսիաներ կառուցելու երկու տարբերակ կա.

    Ընտրված ռեգրեսիաների (միտման գծերի) ավելացում գծապատկերում, որը կառուցված է ուսումնասիրված գործընթացի բնութագրիչի տվյալների աղյուսակի հիման վրա (հասանելի է միայն գծապատկերի կառուցման դեպքում);

    Excel-ի աշխատաթերթի ներկառուցված վիճակագրական գործառույթների օգտագործումը, որը թույլ է տալիս ստանալ ռեգրեսիաներ (միտման գծեր) անմիջապես աղբյուրի տվյալների աղյուսակից:

Գծապատկերում միտումների ավելացում

Տվյալների աղյուսակի համար, որը նկարագրում է որոշակի գործընթաց և ներկայացված է դիագրամով, Excel-ն ունի ռեգրեսիայի վերլուծության արդյունավետ գործիք, որը թույլ է տալիս.

    կառուցել նվազագույն քառակուսիների մեթոդի հիման վրա և դիագրամին ավելացնել հինգ տեսակի ռեգրեսիաներ, որոնք մոդելավորում են ուսումնասիրվող գործընթացը տարբեր աստիճանի ճշգրտությամբ.

    դիագրամին ավելացնել կառուցված ռեգրեսիայի հավասարումը.

    որոշել ընտրված ռեգրեսիայի համապատասխանության աստիճանը գծապատկերում ցուցադրված տվյալների հետ:

Գծապատկերի տվյալների հիման վրա Excel-ը թույլ է տալիս ստանալ ռեգրեսիաների գծային, բազմանդամ, լոգարիթմական, էքսպոնենցիալ, էքսպոնենցիալ տեսակներ, որոնք տրված են հավասարմամբ.

y = y(x)

որտեղ x-ը անկախ փոփոխական է, որը հաճախ վերցնում է բնական թվերի հաջորդականության արժեքները (1; 2; 3; ...) և արտադրում է, օրինակ, ուսումնասիրվող գործընթացի ժամանակի հետհաշվարկը (բնութագրերը) .

1 . Գծային ռեգրեսիան լավ է մոդելավորում այն ​​հատկանիշները, որոնք աճում կամ նվազում են հաստատուն արագությամբ: Սա ուսումնասիրվող գործընթացի ամենապարզ մոդելն է։ Այն կառուցված է ըստ հավասարման.

y=mx+b

որտեղ m-ը գծային ռեգրեսիայի թեքության շոշափումն է x առանցքին. b - y առանցքի հետ գծային ռեգրեսիայի հատման կետի կոորդինատը.

2 . Բազմանդամային միտումը օգտակար է բնութագրերի նկարագրության համար, որոնք ունեն մի քանի տարբեր ծայրահեղություններ (բարձր և ցածր): Բազմանանդամի աստիճանի ընտրությունը որոշվում է ուսումնասիրվող հատկանիշի ծայրահեղությունների քանակով։ Այսպիսով, երկրորդ աստիճանի բազմանդամը կարող է լավ նկարագրել մի գործընթաց, որն ունի միայն մեկ առավելագույն կամ նվազագույն; երրորդ աստիճանի բազմանդամ - ոչ ավելի, քան երկու ծայրահեղություն; չորրորդ աստիճանի բազմանդամ - ոչ ավելի, քան երեք ծայրահեղություն և այլն:

Այս դեպքում միտումի գիծը կառուցվում է հետևյալ հավասարման համաձայն.

y = c0 + c1x + c2x2 + c3x3 + c4x4 + c5x5 + c6x6

որտեղ c0, c1, c2,... c6 գործակիցները հաստատուններ են, որոնց արժեքները որոշվում են շինարարության ընթացքում:

3 . Լոգարիթմական միտումի գիծը հաջողությամբ օգտագործվում է մոդելավորման բնութագրերում, որոնց արժեքները սկզբում արագ փոխվում են, այնուհետև աստիճանաբար կայունանում են:

y = c ln(x) + b

4 . Էլեկտրաէներգիայի միտման գիծը լավ արդյունքներ է տալիս, եթե ուսումնասիրված կախվածության արժեքները բնութագրվում են աճի տեմպի մշտական ​​փոփոխությամբ: Նման կախվածության օրինակ կարող է ծառայել որպես մեքենայի միատեսակ արագացված շարժման գրաֆիկ: Եթե ​​տվյալների մեջ կան զրոյական կամ բացասական արժեքներ, դուք չեք կարող օգտագործել հոսանքի միտման գիծ:

Այն կառուցված է հետևյալ հավասարման համաձայն.

y = cxb

որտեղ b, c գործակիցները հաստատուններ են:

5 . Էքսպոնենցիալ միտումի գիծը պետք է օգտագործվի, եթե տվյալների փոփոխության տեմպերը շարունակաբար աճում են: Զրո կամ բացասական արժեքներ պարունակող տվյալների համար նման մոտարկումը նույնպես կիրառելի չէ:

Այն կառուցված է հետևյալ հավասարման համաձայն.

y=cebx

որտեղ b, c գործակիցները հաստատուններ են:

Թրենդային գիծ ընտրելիս Excel-ը ավտոմատ կերպով հաշվարկում է R2-ի արժեքը, որը բնութագրում է մոտարկման ճշգրտությունը. որքան R2 արժեքը մոտ է մեկին, այնքան տենդենցի գիծը ավելի հուսալի է մոտեցնում ուսումնասիրվող գործընթացին: Անհրաժեշտության դեպքում R2-ի արժեքը միշտ կարող է ցուցադրվել դիագրամի վրա:

Որոշվում է բանաձևով.

Տվյալների շարքին միտման գիծ ավելացնելու համար՝

    ակտիվացրեք տվյալների շարքի հիման վրա կառուցված գծապատկերը, այսինքն՝ սեղմեք գծապատկերի տարածքում: Գծապատկերի տարրը կհայտնվի հիմնական ընտրացանկում;

    Այս տարրի վրա սեղմելուց հետո էկրանին կհայտնվի մենյու, որում պետք է ընտրել Add trend line հրամանը։

Նույն գործողությունները հեշտությամբ իրականացվում են, եթե սավառնել եք տվյալների շարքերից մեկին համապատասխանող գրաֆիկի վրա և սեղմել աջը. համատեքստի ընտրացանկում, որը երևում է, ընտրեք Add trend line հրամանը: Էկրանի վրա կհայտնվի Trendline երկխոսության տուփը, երբ բացված է Type ներդիրը (նկ. 1):

Դրանից հետո ձեզ հարկավոր է.

Տիպ ներդիրում ընտրեք պահանջվող միտումի գծի տեսակը (Գծայինը ընտրված է լռելյայն): Polynomial տեսակի համար Degree դաշտում նշեք ընտրված բազմանդամի աստիճանը:

1 . Կառուցված շարքի վրա դաշտը թվարկում է տվյալ գծապատկերի բոլոր տվյալների շարքերը: Տվյալների որոշակի շարքին միտում ավելացնելու համար ընտրեք դրա անունը Կառուցված սերիայի դաշտում:

Անհրաժեշտության դեպքում, անցնելով Պարամետրեր ներդիր (նկ. 2), կարող եք տենդենցի գծի համար սահմանել հետևյալ պարամետրերը.

    փոխեք միտումի գծի անվանումը մոտավոր (հարթեցված) կորի դաշտում:

    Կանխատեսման դաշտում սահմանել ժամանակաշրջանների քանակը (առաջ կամ հետընթաց) կանխատեսման համար.

    Ցուցադրել գծի գծի հավասարումը գծապատկերի տարածքում, որի համար պետք է միացնեք վանդակը՝ ցույց տալ գծապատկերի հավասարումը.

    Ցուցադրել մոտավոր հուսալիության R2 արժեքը դիագրամի տարածքում, որի համար դուք պետք է միացնեք վանդակը դիագրամի վրա դնել մոտարկման հուսալիության արժեքը (R^2).

    սահմանեք տենդենցի գծի հատման կետը Y առանցքի հետ, որի համար պետք է միացնեք կորի հատման կետը Y առանցքի հետ մի կետում.

    սեղմեք OK կոճակը՝ երկխոսության տուփը փակելու համար:

Արդեն կառուցված միտումների գիծը խմբագրելու երեք եղանակ կա.

    օգտագործեք Ընտրված միտումի գիծ հրամանը Ձևաչափի ընտրացանկից՝ միտումի գիծն ընտրելուց հետո;

    համատեքստի ընտրացանկից ընտրեք Format Trendline հրամանը, որը կանչվում է՝ աջ սեղմելով trendline-ի վրա;

    կրկնակի սեղմելով միտումի գծի վրա:

Էկրանի վրա կհայտնվի Format Trendline երկխոսության տուփը (նկ. 3), որը պարունակում է երեք ներդիր՝ View, Type, Parameters, և վերջին երկուսի բովանդակությունը լիովին համընկնում է Trendline երկխոսության տուփի նմանատիպ ներդիրների հետ (նկ. 1-2): ) Դիտել ներդիրում կարող եք սահմանել գծի տեսակը, դրա գույնը և հաստությունը:

Արդեն կառուցված միտումների գիծը ջնջելու համար ընտրեք ջնջվող միտումի գիծը և սեղմեք Ջնջել ստեղնը:

Դիտարկվող ռեգրեսիոն վերլուծության գործիքի առավելություններն են.

    գծապատկերների վրա միտումի գիծ գծելու հարաբերական հեշտությունը՝ առանց դրա համար տվյալների աղյուսակ ստեղծելու.

    առաջարկվող միտումների գծերի տեսակների բավականին լայն ցանկ, և այս ցանկը ներառում է ռեգրեսիայի ամենատարածված տեսակները.

    ուսումնասիրվող գործընթացի վարքագիծը կանխատեսելու հնարավորությունը կամայական (առողջ բանականության սահմաններում) մի շարք քայլերի առաջ, ինչպես նաև ետ.

    միտումի գծի հավասարումը վերլուծական ձևով ստանալու հնարավորությունը.

    անհրաժեշտության դեպքում մոտարկման հավաստիության գնահատական ​​ստանալու հնարավորությունը։

Թերությունները ներառում են հետևյալ կետերը.

    Միտման գծի կառուցումն իրականացվում է միայն այն դեպքում, եթե կա մի շարք տվյալների վրա կառուցված գծապատկեր.

    Ուսումնասիրվող բնութագրի համար տվյալների շարքերի ստեղծման գործընթացը, որը հիմնված է դրա համար ձեռք բերված միտումի գծի հավասարումների վրա, որոշ չափով խառնաշփոթ է. ցանկալի ռեգրեսիոն հավասարումները թարմացվում են սկզբնական տվյալների շարքի արժեքների յուրաքանչյուր փոփոխության հետ, բայց միայն գծապատկերի տարածքում: , մինչդեռ հին գծային հավասարման միտումի հիման վրա ձևավորված տվյալների շարքը մնում է անփոփոխ.

    PivotChart հաշվետվություններում, երբ փոխում եք գծապատկերի տեսքը կամ առնչվող PivotTable հաշվետվությունը, գոյություն ունեցող միտումների գծերը չեն պահպանվում, այնպես որ դուք պետք է համոզվեք, որ հաշվետվության դասավորությունը համապատասխանում է ձեր պահանջներին՝ նախքան միտումների գծերը գծելը կամ այլ կերպ ձևավորելը PivotChart զեկույցը:

Միտման գծերը կարող են ավելացվել գծապատկերների վրա ներկայացված տվյալների շարքերին, ինչպիսիք են գրաֆիկը, հիստոգրամը, հարթ չնորմալացված տարածքի գծապատկերները, բարակ, ցրումը, փուչիկների և ֆոնդային գծապատկերները:

Դուք չեք կարող միտումներ ավելացնել 3-D, Standard, Radar, Pie և Donut գծապատկերների տվյալների շարքին:

Օգտագործելով ներկառուցված Excel գործառույթներ

Excel-ը նաև տրամադրում է ռեգրեսիայի վերլուծության գործիք՝ գծապատկերի տարածքից դուրս միտումների գծերի գծագրման համար: Այս նպատակով կարող են օգտագործվել վիճակագրական աշխատանքային թերթիկի մի շարք ֆունկցիաներ, սակայն դրանք բոլորը թույլ են տալիս կառուցել միայն գծային կամ էքսպոնենցիալ ռեգրեսիաներ։

Excel-ն ունի գծային ռեգրեսիա կառուցելու մի քանի գործառույթ, մասնավորապես.

    TREND;

  • ԼԱՆՔ եւ ԿՏՐՈՒՄ.

Ինչպես նաև էքսպոնենցիալ միտումի գիծ կառուցելու մի քանի գործառույթ, մասնավորապես.

    LGRFPմոտ.

Պետք է նշել, որ TREND և GROWTH ֆունկցիաների օգտագործմամբ ռեգրեսիաների կառուցման տեխնիկան գործնականում նույնն է: Նույնը կարելի է ասել LINEST և LGRFPRIBL ֆունկցիաների զույգի մասին։ Այս չորս գործառույթների համար արժեքների աղյուսակ ստեղծելիս օգտագործվում են Excel-ի այնպիսի գործառույթներ, ինչպիսիք են զանգվածի բանաձևերը, ինչը որոշակիորեն խաթարում է ռեգրեսիաների կառուցման գործընթացը: Մենք նաև նշում ենք, որ գծային ռեգրեսիայի կառուցումը, մեր կարծիքով, ամենահեշտն է իրականացնել SLOPE և INTERCEPT ֆունկցիաների միջոցով, որտեղ դրանցից առաջինը որոշում է գծային ռեգրեսիայի թեքությունը, իսկ երկրորդը որոշում է ռեգրեսիայի կողմից կտրված հատվածը: y առանցքի վրա:

Ռեգրեսիոն վերլուծության համար ներկառուցված գործառույթների գործիքի առավելություններն են.

    ուսումնասիրվող բնութագրիչի տվյալների շարքերի ձևավորման միևնույն տիպի բավականին պարզ գործընթաց բոլոր ներկառուցված վիճակագրական գործառույթների համար, որոնք սահմանում են միտումների գծեր.

    գեներացված տվյալների շարքի հիման վրա միտումների գծերի կառուցման ստանդարտ տեխնիկա.

    ուսումնասիրվող գործընթացի վարքագիծը կանխատեսելու ունակություն՝ առաջ կամ հետ գնալու անհրաժեշտ քանակի քայլերի համար:

Իսկ թերությունները ներառում են այն փաստը, որ Excel-ը չունի ներկառուցված գործառույթներ այլ (բացառությամբ գծային և էքսպոնենցիալ) տեսակի միտումների գծերի ստեղծման համար։ Այս հանգամանքը հաճախ թույլ չի տալիս ընտրել ուսումնասիրվող գործընթացի բավական ճշգրիտ մոդել, ինչպես նաև ստանալ իրականությանը մոտ կանխատեսումներ։ Բացի այդ, TREND և GROW ֆունկցիաները օգտագործելիս միտումների գծերի հավասարումները հայտնի չեն:

Հարկ է նշել, որ հեղինակները հոդվածի նպատակ չեն դրել ներկայացնել ռեգրեսիոն վերլուծության ընթացքը տարբեր աստիճանի ամբողջականությամբ։ Նրա հիմնական խնդիրն է ցույց տալ Excel փաթեթի հնարավորությունները մոտավոր խնդիրների լուծման մեջ՝ օգտագործելով կոնկրետ օրինակներ. ցույց տալ, թե ինչ արդյունավետ գործիքներ ունի Excel-ը ռեգրեսիաներ կառուցելու և կանխատեսելու համար. ցույց է տալիս, թե որքան համեմատաբար հեշտ է նման խնդիրները լուծել նույնիսկ այն օգտվողը, ով չունի ռեգրեսիոն վերլուծության խորը գիտելիքներ:

Հատուկ խնդիրների լուծման օրինակներ

Դիտարկենք հատուկ խնդիրների լուծումը՝ օգտագործելով Excel փաթեթի թվարկված գործիքները:

Առաջադրանք 1

1995-2002 թվականների ավտոտրանսպորտային ձեռնարկության շահույթի վերաբերյալ տվյալների աղյուսակով. դուք պետք է անեք հետևյալը.

    Կառուցեք գծապատկեր:

    Գծապատկերում ավելացրեք գծային և բազմանդամ (քառանկյուն և խորանարդ) միտումների գծեր:

    Օգտագործելով միտումների գծի հավասարումները, ստացեք աղյուսակային տվյալներ ձեռնարկության շահույթի վերաբերյալ 1995-2004 թվականների յուրաքանչյուր միտումի գծի համար:

    Կատարեք ձեռնարկության շահույթի կանխատեսում 2003 և 2004 թվականների համար:

Խնդրի լուծումը

    Excel-ի աշխատաթերթի A4:C11 բջիջների տիրույթում մենք մուտքագրում ենք նկ. 4.

    Ընտրելով B4:C11 բջիջների տիրույթը՝ մենք կառուցում ենք գծապատկեր:

    Մենք ակտիվացնում ենք կառուցված գծապատկերը և, օգտագործելով վերը նկարագրված մեթոդը, Trend Line երկխոսության վանդակում տենդենցի գծի տեսակն ընտրելուց հետո (տե՛ս Նկար 1), մենք հերթափոխով ավելացնում ենք գծային, քառակուսի և խորանարդ միտումների գծեր գծապատկերում: Նույն երկխոսության վանդակում բացեք Պարամետրեր ներդիրը (տես նկ. 2), մոտավոր (հարթեցված) կորի դաշտում մուտքագրեք ավելացվող միտումի անվանումը և «Կանխատեսում առաջ՝ ժամանակաշրջանների համար» դաշտում սահմանեք: արժեքը 2, քանի որ նախատեսվում է շահույթի կանխատեսում կատարել առաջիկա երկու տարվա համար։ Ռեգրեսիոն հավասարումը և մոտավոր հուսալիության R2 արժեքը դիագրամների տարածքում ցուցադրելու համար միացրեք վանդակները Ցույց տալ հավասարումը էկրանին և մոտավոր հուսալիության արժեքը (R^2) դնել դիագրամի վրա: Ավելի լավ տեսողական ընկալման համար մենք փոխում ենք գծագրված միտումների գծերի տեսակը, գույնը և հաստությունը, ինչի համար օգտագործում ենք Trend Line Format երկխոսության տուփի View ներդիրը (տես նկ. 3): Ստացված գծապատկերը՝ ավելացված միտումների գծերով, ներկայացված է նկ. 5.

    Ձեռք բերել աղյուսակային տվյալներ ձեռնարկության շահույթի վերաբերյալ յուրաքանչյուր միտումի գծի համար 1995-2004 թթ. Եկեք օգտագործենք թրենդային գծերի հավասարումները, որոնք ներկայացված են նկ. 5. Դա անելու համար D3:F3 տիրույթի բջիջներում մուտքագրեք տեքստային տեղեկատվություն ընտրված միտումի գծի տեսակի մասին՝ Գծային միտում, Քառակուսի միտում, Խորանարդ միտում: Հաջորդը, մուտքագրեք գծային ռեգրեսիայի բանաձևը D4 բջիջում և, օգտագործելով լրացման նշիչը, պատճենեք այս բանաձևը D5:D13 բջիջների տիրույթի հարաբերական հղումներով: Հարկ է նշել, որ D4:D13 բջիջների տիրույթից գծային ռեգրեսիայի բանաձևով յուրաքանչյուր բջիջ որպես արգումենտ ունի համապատասխան բջիջ A4:A13 միջակայքից։ Նմանապես, քառակուսային ռեգրեսիայի համար լրացվում է E4:E13 բջիջների միջակայքը, իսկ խորանարդ ռեգրեսիայի դեպքում՝ F4:F13 բջիջների միջակայքը: Այսպիսով, ձեռնարկության շահույթի կանխատեսում է արվել 2003 և 2004 թվականների համար։ երեք միտումներով. Ստացված արժեքների աղյուսակը ներկայացված է նկ. 6.

Առաջադրանք 2

    Կառուցեք գծապատկեր:

    Գծապատկերում ավելացրեք լոգարիթմական, էքսպոնենցիալ և էքսպոնենցիալ միտումների գծեր:

    Ստացված միտման գծերի հավասարումները, ինչպես նաև դրանցից յուրաքանչյուրի համար մոտավոր հուսալիության R2 արժեքները:

    Օգտագործելով միտումների գծի հավասարումները, ստացեք աղյուսակային տվյալներ ձեռնարկության շահույթի վերաբերյալ 1995-2002 թվականների յուրաքանչյուր միտումի գծի համար:

    Կատարեք բիզնեսի շահույթի կանխատեսում 2003 և 2004 թվականների համար՝ օգտագործելով այս միտումների գծերը:

Խնդրի լուծումը

Հետևելով 1-ին խնդրի լուծմանը տրված մեթոդաբանությանը, մենք ստանում ենք դիագրամ՝ ավելացված լոգարիթմական, էքսպոնենցիալ և էքսպոնենցիալ միտումների գծերով (նկ. 7): Այնուհետև, օգտագործելով ձեռք բերված միտումների գծի հավասարումները, մենք լրացնում ենք ձեռնարկության շահույթի արժեքների աղյուսակը, ներառյալ 2003 և 2004 թվականների կանխատեսված արժեքները: (նկ. 8):

Նկ. 5 և նկ. երևում է, որ լոգարիթմական միտումով մոդելը համապատասխանում է մոտարկման հուսալիության ամենացածր արժեքին.

R2 = 0,8659

R2-ի ամենաբարձր արժեքները համապատասխանում են բազմանդամ միտում ունեցող մոդելներին՝ քառակուսի (R2 = 0,9263) և խորանարդ (R2 = 0,933):

Առաջադրանք 3

1-ին առաջադրանքում տրված 1995-2002 թվականների ավտոտրանսպորտային ձեռնարկության շահույթի վերաբերյալ տվյալների աղյուսակով դուք պետք է կատարեք հետևյալ քայլերը.

    Ստացեք տվյալների շարքեր գծային և էքսպոնենցիալ միտումների համար՝ օգտագործելով TREND և GROW ֆունկցիաները:

    Օգտագործելով TREND և GROWTH ֆունկցիաները, կատարեք ձեռնարկության շահույթի կանխատեսում 2003 և 2004 թվականների համար:

    Սկզբնական տվյալների և ստացված տվյալների շարքի համար կառուցեք դիագրամ:

Խնդրի լուծումը

Եկեք օգտագործենք առաջադրանքի 1-ին աշխատանքային թերթիկը (տես նկ. 4): Սկսենք TREND ֆունկցիայից.

    ընտրեք D4:D11 բջիջների շրջանակը, որը պետք է լրացվի TREND ֆունկցիայի արժեքներով, որոնք համապատասխանում են ձեռնարկության շահույթի մասին հայտնի տվյալներին.

    Զանգահարեք Function հրամանը Insert ցանկից: «Function Wizard» երկխոսության դաշտում, որը երևում է, ընտրեք «TREND» գործառույթը «Վիճակագրական» կատեգորիայից և սեղմեք «OK» կոճակը: Նույն գործողությունը կարելի է կատարել՝ սեղմելով ստանդարտ գործիքագոտու կոճակը (Insert function):

    Ֆունկցիայի փաստարկներ երկխոսության վանդակում, որը հայտնվում է, մուտքագրեք C4:C11 բջիջների տիրույթը Known_values_y դաշտում; Known_values_x դաշտում - B4:B11 բջիջների տիրույթը;

    մուտքագրված բանաձևը զանգվածի բանաձև դարձնելու համար օգտագործեք + + ստեղնաշարի համակցությունը:

Բանաձևը, որը մենք մուտքագրել ենք բանաձևերի տողում, կունենա հետևյալ տեսքը՝ =(TREND(C4:C11;B4:B11)):

Արդյունքում D4:D11 բջիջների տիրույթը լրացվում է TREND ֆունկցիայի համապատասխան արժեքներով (նկ. 9):

Կատարել ընկերության շահույթի կանխատեսում 2003 եւ 2004 թթ. անհրաժեշտ:

    ընտրեք D12:D13 բջիջների տիրույթը, որտեղ մուտքագրվելու են TREND ֆունկցիայի կողմից կանխատեսված արժեքները:

    կանչեք TREND ֆունկցիան և երևացող Function Arguments երկխոսության վանդակում մուտքագրեք Known_values_y դաշտում՝ C4:C11 բջիջների տիրույթը; Known_values_x դաշտում - B4:B11 բջիջների տիրույթը; իսկ New_values_x դաշտում՝ B12:B13 բջիջների տիրույթը:

    այս բանաձևը վերածեք զանգվածի բանաձևի՝ օգտագործելով ստեղնաշարի դյուրանցումը Ctrl + Shift + Enter:

    Մուտքագրված բանաձևը կունենա հետևյալ տեսքը. 9):

Նմանապես, տվյալների շարքը լրացվում է օգտագործելով GROWTH ֆունկցիան, որն օգտագործվում է ոչ գծային կախվածությունների վերլուծության մեջ և աշխատում է ճիշտ այնպես, ինչպես իր գծային TREND-ը:

Նկար 10-ը ցույց է տալիս աղյուսակը բանաձևի ցուցադրման ռեժիմում:

Սկզբնական տվյալների և ստացված տվյալների շարքի համար նկ. տասնմեկ.

Առաջադրանք 4

Ընթացիկ ամսվա 1-ից 11-ն ընկած ժամանակահատվածում ավտոտրանսպորտային ձեռնարկության դիսպետչերական ծառայության կողմից ծառայությունների հայտերի ստացման վերաբերյալ տվյալների աղյուսակով պետք է կատարվեն հետևյալ գործողությունները.

    Ստացեք տվյալների շարք գծային ռեգրեսիայի համար՝ օգտագործելով SLOPE և INTERCEPT ֆունկցիաները; օգտագործելով LINEST ֆունկցիան:

    Ստացեք տվյալների շարք էքսպոնենցիալ ռեգրեսիայի համար՝ օգտագործելով LYFFPRIB ֆունկցիան:

    Օգտագործելով վերը նշված գործառույթները, կատարեք կանխատեսում ընթացիկ ամսվա 12-ից 14-ը ընկած ժամանակահատվածում դիսպետչերական ծառայության դիմումների ստացման վերաբերյալ:

    Բնօրինակ և ստացված տվյալների շարքի համար կառուցեք դիագրամ:

Խնդրի լուծումը

Նկատի ունեցեք, որ, ի տարբերություն TREND և GROW ֆունկցիաների, վերը թվարկված գործառույթներից և ոչ մեկը (SLOPE, INTERCEPTION, LINEST, LGRFPRIB) ռեգրեսիա չէ: Այս գործառույթները խաղում են միայն օժանդակ դեր՝ որոշելով ռեգրեսիայի անհրաժեշտ պարամետրերը։

SLOPE, INTERCEPT, LINEST, LGRFINB ֆունկցիաներով կառուցված գծային և էքսպոնենցիալ ռեգրեսիաների համար միշտ հայտնի է դրանց հավասարումների տեսքը՝ ի տարբերություն TREND և GROWTH ֆունկցիաներին համապատասխանող գծային և էքսպոնենցիալ ռեգրեսիաների։

1 . Եկեք կառուցենք գծային ռեգրեսիա, որն ունի հավասարում.

y=mx+b

օգտագործելով SLOPE և INTERCEPT ֆունկցիաները՝ m ռեգրեսիայի թեքությունը որոշվում է SLOPE ֆունկցիայով, իսկ b հաստատուն անդամը՝ INTERCEPT ֆունկցիայով:

Դա անելու համար մենք կատարում ենք հետևյալ գործողությունները.

    մուտքագրեք աղբյուրի աղյուսակը A4:B14 բջիջների միջակայքում;

    m պարամետրի արժեքը կորոշվի C19 բջիջում: Վիճակագրական կատեգորիայից ընտրել Slope ֆունկցիան; մուտքագրեք B4:B14 բջիջների միջակայքը հայտնի_արժեքներ_y դաշտում, իսկ A4:A14 բջիջների տիրույթը՝ հայտնի_արժեք_x դաշտում: Բանաձևը մուտքագրվելու է C19 բջիջ. =SLOPE(B4:B14;A4:A14);

    օգտագործելով նմանատիպ մեթոդ, որոշվում է b պարամետրի արժեքը D19 բջիջում: Եվ դրա բովանդակությունը կունենա հետևյալ տեսքը՝ = INTERCEPT(B4:B14;A4:A14): Այսպիսով, m և b պարամետրերի արժեքները, որոնք անհրաժեշտ են գծային ռեգրեսիա կառուցելու համար, կպահվեն համապատասխանաբար C19, D19 բջիջներում;

    այնուհետև C4 բջիջում մուտքագրում ենք գծային ռեգրեսիայի բանաձևը՝ = $ C * A4 + $ D: Այս բանաձևում C19 և D19 բջիջները գրված են բացարձակ հղումներով (բջջի հասցեն չպետք է փոխվի հնարավոր պատճենմամբ): $ բացարձակ հղման նշանը կարելի է մուտքագրել կամ ստեղնաշարից կամ օգտագործելով F4 ստեղնը՝ կուրսորը բջջային հասցեի վրա դնելուց հետո: Օգտագործելով լրացման բռնակը, պատճենեք այս բանաձևը C4:C17 բջիջների տիրույթում: Մենք ստանում ենք ցանկալի տվյալների շարքը (նկ. 12): Հաշվի առնելով այն հանգամանքը, որ հարցումների թիվը ամբողջ թիվ է, դուք պետք է թվի ձևաչափը սահմանեք «Բջջային ձևաչափ» պատուհանի «Թիվ» ներդիրում՝ տասնորդական վայրերի թվով 0:

2 . Հիմա եկեք կառուցենք գծային ռեգրեսիա, որը տրված է հավասարմամբ.

y=mx+b

օգտագործելով LINEST ֆունկցիան:

Սրա համար:

    մուտքագրեք LINEST ֆունկցիան որպես զանգվածի բանաձև C20:D20: =(LINEST(B4:B14;A4:A14) բջիջների տիրույթում: Արդյունքում մենք ստանում ենք m պարամետրի արժեքը C20 բջիջում, իսկ b պարամետրի արժեքը D20 բջիջում;

    մուտքագրեք բանաձևը D4 բջիջում՝ =$C*A4+$D;

    պատճենեք այս բանաձևը՝ օգտագործելով լրացման նշիչը D4:D17 բջիջների տիրույթում և ստացեք ցանկալի տվյալների շարքը:

3 . Մենք կառուցում ենք էքսպոնենցիալ ռեգրեսիա, որն ունի հավասարում.

LGRFPRIBL ֆունկցիայի օգնությամբ այն կատարվում է նույն կերպ.

    C21:D21 բջիջների միջակայքում մուտքագրեք LGRFPRIBL ֆունկցիան որպես զանգվածի բանաձև՝ =( LGRFPRIBL (B4:B14;A4:A14)): Այս դեպքում m պարամետրի արժեքը կորոշվի C21 բջիջում, իսկ b պարամետրի արժեքը՝ D21 բջիջում;

    բանաձևը մուտքագրվում է E4 բջիջում՝ =$D*$C^A4;

    օգտագործելով լրացման նշիչը, այս բանաձևը պատճենվում է E4:E17 բջիջների տիրույթում, որտեղ տեղակայվելու է էքսպոնենցիալ ռեգրեսիայի տվյալների շարքը (տես նկ. 12):

Նկ. 13-ը ցույց է տալիս աղյուսակ, որտեղ մենք կարող ենք տեսնել այն գործառույթները, որոնք մենք օգտագործում ենք անհրաժեշտ բջիջների միջակայքերով, ինչպես նաև բանաձևեր:

Արժեք Ռ 2 կանչեց որոշման գործակիցը.

Ռեգրեսիոն կախվածության կառուցման խնդիրն է գտնել մոդելի m գործակիցների վեկտորը (1), որի դեպքում R գործակիցը վերցնում է առավելագույն արժեքը։

R-ի նշանակությունը գնահատելու համար օգտագործվում է Ֆիշերի F-թեստը, որը հաշվարկվում է բանաձևով

Որտեղ n- նմուշի չափը (փորձերի քանակը);

k-ն մոդելի գործակիցների թիվն է:

Եթե ​​F-ը գերազանցում է տվյալների համար որոշ կրիտիկական արժեք nԵվ կև ընդունված վստահության մակարդակը, ապա R-ի արժեքը համարվում է նշանակալի: F-ի կրիտիկական արժեքների աղյուսակները տրված են մաթեմատիկական վիճակագրության տեղեկատու գրքերում:

Այսպիսով, R-ի նշանակությունը որոշվում է ոչ միայն նրա արժեքով, այլ նաև փորձերի քանակի և մոդելի գործակիցների (պարամետրերի) քանակի հարաբերակցությամբ։ Իրոք, n=2-ի հարաբերակցությունը պարզ գծային մոդելի համար 1 է (հարթության 2 կետերի միջով միշտ կարող եք մեկ ուղիղ գիծ գծել): Այնուամենայնիվ, եթե փորձարարական տվյալները պատահական փոփոխականներ են, R-ի նման արժեքին պետք է մեծ զգուշությամբ վստահել: Սովորաբար, զգալի R և հուսալի ռեգրեսիա ստանալու համար այն նպատակաուղղված է ապահովելու, որ փորձերի թիվը զգալիորեն գերազանցի մոդելային գործակիցների թիվը (n>k):

Գծային ռեգրեսիայի մոդել կառուցելու համար դուք պետք է.

1) պատրաստել փորձնական տվյալները պարունակող n տողերի և m սյունակների ցուցակ (ելքային արժեքը պարունակող սյունակ). Յպետք է լինի առաջինը կամ վերջինը ցանկում); օրինակ՝ վերցնենք նախորդ առաջադրանքի տվյալները՝ ավելացնելով «ժամանակահատվածի համար» կոչվող սյունակը՝ համարակալելով 1-ից 12 պարբերաշրջանների համարները (սրանք կլինեն արժեքները. X)

2) անցեք մենյու Տվյալների/Տվյալների վերլուծություն/Ռեգրեսիա

Եթե ​​«Գործիքներ» ցանկի «Տվյալների վերլուծություն» կետը բացակայում է, ապա դուք պետք է գնաք նույն ցանկի «Հավելումներ» կետը և նշեք «Վերլուծական փաթեթ» վանդակը:

3) «Regression» երկխոսության վանդակում սահմանեք.

մուտքագրման միջակայքը Y;

մուտքագրման միջակայք X;

ելքային ինտերվալ - այն միջակայքի վերին ձախ բջիջը, որում կտեղադրվեն հաշվարկի արդյունքները (խորհուրդ է տրվում տեղադրել այն նոր աշխատաթերթում);

4) սեղմեք «Ok» և վերլուծեք արդյունքները:

Եթե ​​որոշ ֆիզիկական մեծություն կախված է մեկ այլ մեծությունից, ապա այդ կախվածությունը կարելի է ուսումնասիրել՝ y-ն x-ի տարբեր արժեքներով չափելով: Չափումների արդյունքում ստացվում է մի շարք արժեքներ.

x 1, x 2, ..., x i, ..., x n;

y 1, y 2, ..., y i, ..., y n.

Նման փորձի տվյալների հիման վրա հնարավոր է պատկերել y = ƒ(x) կախվածությունը։ Ստացված կորը հնարավորություն է տալիս դատել ƒ(x) ֆունկցիայի ձևի մասին։ Այնուամենայնիվ, հաստատուն գործակիցները, որոնք մտնում են այս ֆունկցիայի մեջ, մնում են անհայտ: Դրանք կարելի է որոշել՝ օգտագործելով նվազագույն քառակուսիների մեթոդը: Փորձարարական կետերը, որպես կանոն, ճիշտ չեն ընկած կորի վրա։ Նվազագույն քառակուսիների մեթոդը պահանջում է, որ փորձարարական կետերի քառակուսի շեղումների գումարը կորից, այսինքն. 2-ն ամենափոքրն էր:

Գործնականում այս մեթոդը առավել հաճախ (և առավել պարզ) օգտագործվում է գծային հարաբերությունների դեպքում, այսինքն. Երբ

y=kxկամ y = a + bx.

Գծային կախվածությունը շատ տարածված է ֆիզիկայում։ Եվ նույնիսկ երբ կախվածությունը ոչ գծային է, նրանք սովորաբար փորձում են գրաֆիկ կառուցել այնպես, որ ուղիղ գիծ ստանա։ Օրինակ, եթե ենթադրվում է, որ n ապակու բեկման ինդեքսը կապված է լուսային ալիքի λ ալիքի երկարության հետ n = a + b/λ 2 հարաբերակցությամբ, ապա գրաֆիկի վրա գծվում է n-ի կախվածությունը λ -2-ից: .

Հաշվի առեք կախվածությունը y=kx(ուղիղ, որն անցնում է սկզբնաղբյուրով): Եկեք կազմենք φ արժեքը ուղիղ գծից մեր կետերի քառակուսի շեղումների գումարը

Φ-ի արժեքը միշտ դրական է և պարզվում է, որ որքան փոքր է, այնքան մեր կետերը մոտ են ուղիղ գծին: Նվազագույն քառակուսիների մեթոդը նշում է, որ k-ի համար պետք է ընտրել այնպիսի արժեք, որի դեպքում φ-ն ունի նվազագույնը


կամ
(19)

Հաշվարկը ցույց է տալիս, որ k-ի արժեքը որոշելիս արմատ-միջին քառակուսի սխալը հավասար է.

, (20)
որտեղ n-ը չափերի թիվն է:

Այժմ դիտարկենք մի փոքր ավելի բարդ դեպք, երբ կետերը պետք է բավարարեն բանաձևին y = a + bx(ուղիղ, որը չի անցնում սկզբնակետով):

Խնդիրն է՝ գտնել a և b-ի լավագույն արժեքները տվյալ x i, y i արժեքների բազմությունից:

Կրկին կազմում ենք քառակուսի φ ձև, որը հավասար է x i, y i կետերի քառակուսի շեղումների գումարին ուղիղ գծից:

և գտե՛ք a և b արժեքները, որոնց համար φ ունի նվազագույնը

;

.

.

Այս հավասարումների համատեղ լուծումը տալիս է

(21)

a-ի և b-ի որոշման արմատ-միջին քառակուսի սխալները հավասար են

(23)

.  (24)

Այս մեթոդով չափումների արդյունքները մշակելիս հարմար է բոլոր տվյալները ամփոփել աղյուսակում, որում նախապես հաշվարկված են (19)(24) բանաձևերում ներառված բոլոր գումարները: Այս աղյուսակների ձևերը ներկայացված են ստորև բերված օրինակներում:

Օրինակ 1Ուսումնասիրվել է ε = M/J պտտվող շարժման դինամիկայի հիմնական հավասարումը (սկիզբով անցնող ուղիղ գիծ): Մ պահի տարբեր արժեքների համար չափվել է որոշակի մարմնի անկյունային արագացումը ε: Պահանջվում է որոշել այս մարմնի իներցիայի պահը։ Ուժի և անկյունային արագացման պահի չափումների արդյունքները թվարկված են երկրորդ և երրորդ սյունակներում. աղյուսակներ 5.

Աղյուսակ 5
n M, N մ ε, s-1 M2 Մ ε ε - կմ (ε - կմ) 2
1 1.44 0.52 2.0736 0.7488 0.039432 0.001555
2 3.12 1.06 9.7344 3.3072 0.018768 0.000352
3 4.59 1.45 21.0681 6.6555 -0.08181 0.006693
4 5.90 1.92 34.81 11.328 -0.049 0.002401
5 7.45 2.56 55.5025 19.072 0.073725 0.005435
– – 123.1886 41.1115 – 0.016436

Բանաձևով (19) մենք որոշում ենք.

.

Արմատ-միջին քառակուսի սխալը որոշելու համար մենք օգտագործում ենք բանաձևը (20)

0.005775կգ-1 · մ -2 .

Բանաձևով (18) ունենք

; .

SJ = (2,996 0,005775)/0,3337 = 0,05185 կգ մ 2.

Հաշվի առնելով P = 0,95 հուսալիությունը, ըստ Student-ի գործակիցների աղյուսակի n = 5-ի համար, մենք գտնում ենք t = 2,78 և որոշում բացարձակ սխալ ΔJ = 2,78 0,05185 = 0,1441 ≈ 0,2: կգ մ 2.

Արդյունքները գրում ենք հետևյալ ձևով.

J = (3,0 ± 0,2) կգ մ 2;


Օրինակ 2Մենք հաշվարկում ենք մետաղի դիմադրության ջերմաստիճանի գործակիցը նվազագույն քառակուսիների մեթոդով: Դիմադրությունը կախված է ջերմաստիճանից՝ համաձայն գծային օրենքի

R t \u003d R 0 (1 + α t °) \u003d R 0 + R 0 α t °:

Ազատ տերմինը որոշում է R 0 դիմադրությունը 0 ° C ջերմաստիճանում, իսկ անկյունային գործակիցը α ջերմաստիճանի գործակցի և R 0 դիմադրության արտադրյալն է:

Չափումների և հաշվարկների արդյունքները տրված են աղյուսակում ( տես աղյուսակ 6).

Աղյուսակ 6
n t°, s r, Օմ t-¯t (t-¯t) 2 (t-¯t)r r-bt-a (r - bt - a) 2,10 -6
1 23 1.242 -62.8333 3948.028 -78.039 0.007673 58.8722
2 59 1.326 -26.8333 720.0278 -35.581 -0.00353 12.4959
3 84 1.386 -1.83333 3.361111 -2.541 -0.00965 93.1506
4 96 1.417 10.16667 103.3611 14.40617 -0.01039 107.898
5 120 1.512 34.16667 1167.361 51.66 0.021141 446.932
6 133 1.520 47.16667 2224.694 71.69333 -0.00524 27.4556
515 8.403 – 8166.833 21.5985 – 746.804
∑/n 85.83333 1.4005 – – – – –

(21), (22) բանաձևերով որոշում ենք

R 0 = ¯ R- α R 0 ¯ t = 1,4005 - 0,002645 85,83333 = 1,1735 Օմ.

Եկեք սխալ գտնենք α-ի սահմանման մեջ: Քանի որ , ապա ըստ բանաձևի (18) մենք ունենք.

.

Օգտագործելով (23), (24) բանաձևերը՝ ունենք

;

0.014126 Օմ.

Հաշվի առնելով P = 0,95 հուսալիությունը, ըստ Student-ի գործակիցների աղյուսակի n = 6-ի համար, մենք գտնում ենք t = 2,57 և որոշում բացարձակ սխալը Δα = 2,57 0,000132 = 0,000338: աստիճան -1.

α = (23 ± 4) 10 -4 կարկուտ-1 ժամը P = 0,95:


Օրինակ 3Պահանջվում է Նյուտոնի օղակներից որոշել ոսպնյակի կորության շառավիղը։ Չափվել են Նյուտոնի օղակների r m շառավիղները և որոշվել են այդ օղակների m թվերը: Նյուտոնի օղակների շառավիղները կապված են R ոսպնյակի կորության շառավիղի և օղակի թվի հետ հավասարմամբ.

r 2 m = mλR - 2d 0 R,

որտեղ d 0 ոսպնյակի և հարթ զուգահեռ ափսեի միջև բացվածքի հաստությունը (կամ ոսպնյակի դեֆորմացիա),

λ-ն ընկնող լույսի ալիքի երկարությունն է:

λ = (600 ± 6) նմ;
r 2 m = y;
m = x;
λR = b;
-2d 0 R = a,

ապա հավասարումը կվերցնի ձևը y = a + bx.

.

Չափումների և հաշվարկների արդյունքները մուտքագրվում են աղյուսակ 7.

Աղյուսակ 7
n x = մ y \u003d r 2, 10 -2 մմ 2 m-¯m (m-¯m) 2 (m-¯m)y y-bx-a, 10-4 (y - bx - a) 2, 10 -6
1 1 6.101 -2.5 6.25 -0.152525 12.01 1.44229
2 2 11.834 -1.5 2.25 -0.17751 -9.6 0.930766
3 3 17.808 -0.5 0.25 -0.08904 -7.2 0.519086
4 4 23.814 0.5 0.25 0.11907 -1.6 0.0243955
5 5 29.812 1.5 2.25 0.44718 3.28 0.107646
6 6 35.760 2.5 6.25 0.894 3.12 0.0975819
21 125.129 – 17.5 1.041175 – 3.12176
∑/n 3.5 20.8548333 – – – – –

Ընտրելով ռեգրեսիոն ֆունկցիայի տեսակը, այսինքն. Y-ի X-ից (կամ X-ից Y-ից) կախվածության դիտարկված մոդելի տեսակը, օրինակ, գծային մոդել y x = a + bx, անհրաժեշտ է որոշել մոդելի գործակիցների հատուկ արժեքները:

a-ի և b-ի տարբեր արժեքների համար հնարավոր է կառուցել y x =a+bx ձևի անսահման թվով կախվածություն, այսինքն՝ կոորդինատային հարթության վրա կան անսահման թվով գծեր, բայց մեզ անհրաժեշտ է այնպիսի կախվածություն, որ լավագույն կերպով համապատասխանում է դիտարկված արժեքներին։ Այսպիսով, խնդիրը կրճատվում է լավագույն գործակիցների ընտրության վրա։

Մենք փնտրում ենք a + bx գծային ֆունկցիա՝ հիմնված միայն որոշակի թվով առկա դիտարկումների վրա։ Դիտարկված արժեքներին լավագույնս համապատասխանող ֆունկցիան գտնելու համար մենք օգտագործում ենք նվազագույն քառակուսիների մեթոդը:

Նշեք՝ Y i - արժեքը, որը հաշվարկվում է Y i =a+bx i հավասարմամբ: y i - չափված արժեք, ε i =y i -Y i - տարբերություն չափված և հաշվարկված արժեքների միջև, ε i =y i -a-bx i:

Նվազագույն քառակուսիների մեթոդը պահանջում է, որ ε i-ը՝ չափված y i-ի և հավասարումից հաշվարկված Y i արժեքների միջև եղած տարբերությունը լինի նվազագույն: Հետևաբար, մենք գտնում ենք a և b գործակիցները, որպեսզի դիտարկված արժեքների քառակուսի շեղումների գումարը ուղիղ ռեգրեսիոն գծի արժեքներից ամենափոքրն է.

Ուսումնասիրելով a փաստարկների այս ֆունկցիան և ծայրահեղության ածանցյալների օգնությամբ՝ կարող ենք ապացուցել, որ ֆունկցիան ստանում է նվազագույն արժեք, եթե a և b գործակիցները համակարգի լուծումներն են.

(2)

Եթե ​​նորմալ հավասարումների երկու կողմերը բաժանենք n-ի, ապա կստանանք.

Հաշվի առնելով, որ (3)

Ստացեք , այստեղից, փոխարինելով a-ի արժեքը առաջին հավասարման մեջ, ստանում ենք.

Այս դեպքում b-ն կոչվում է ռեգրեսիայի գործակից; a կոչվում է ռեգրեսիայի հավասարման ազատ անդամ և հաշվարկվում է բանաձևով.

Ստացված ուղիղ գիծը տեսական ռեգրեսիոն գծի գնահատումն է: Մենք ունենք:

Այսպիսով, գծային ռեգրեսիոն հավասարում է։

Ռեգրեսիան կարող է լինել ուղղակի (b>0) և հակադարձ (b Օրինակ 1: X և Y արժեքների չափման արդյունքները տրված են աղյուսակում.

x i -2 0 1 2 4
y i 0.5 1 1.5 2 3

Ենթադրելով, որ X-ի և Y-ի միջև կա գծային հարաբերություն y=a+bx, որոշեք a և b գործակիցները՝ օգտագործելով նվազագույն քառակուսիների մեթոդը:

Լուծում. Այստեղ n=5
x i =-2+0+1+2+4=5;
x i 2 =4+0+1+4+16=25
x i y i =-2 0,5+0 1+1 1,5+2 2+4 3=16,5
y i =0.5+1+1.5+2+3=8

իսկ նորմալ համակարգը (2) ունի ձևը

Լուծելով այս համակարգը՝ ստանում ենք՝ b=0.425, a=1.175։ Հետեւաբար y=1,175+0,425x.

Օրինակ 2. Տնտեսական ցուցանիշների (X) և (Y) 10 դիտարկումների նմուշ կա:

x i 180 172 173 169 175 170 179 170 167 174
y i 186 180 176 171 182 166 182 172 169 177

Պահանջվում է X-ի վրա գտնել Y ռեգրեսիոն հավասարման նմուշ: X-ի վրա կառուցեք Y ռեգրեսիոն գիծ:

Լուծում. 1. Տեսակավորենք տվյալները ըստ x i և y i արժեքների: Մենք ստանում ենք նոր աղյուսակ.

x i 167 169 170 170 172 173 174 175 179 180
y i 169 171 166 172 180 176 177 182 182 186

Հաշվարկները պարզեցնելու համար մենք կկազմենք հաշվարկային աղյուսակ, որտեղ մուտքագրելու ենք անհրաժեշտ թվային արժեքները։

x i y i x i 2 x i y i
167 169 27889 28223
169 171 28561 28899
170 166 28900 28220
170 172 28900 29240
172 180 29584 30960
173 176 29929 30448
174 177 30276 30798
175 182 30625 31850
179 182 32041 32578
180 186 32400 33480
∑x i =1729 ∑y i =1761 ∑x i 2 299105 ∑x i y i =304696
x=172,9 y=176.1 x i 2 =29910,5 xy=30469.6

Համաձայն (4) բանաձևի, մենք հաշվարկում ենք ռեգրեսիայի գործակիցը

և ըստ բանաձևի (5)

Այսպիսով, օրինակելի ռեգրեսիոն հավասարումը նման է y=-59.34+1.3804x:
Եկեք կոորդինատային հարթության վրա գծենք կետերը (x i ; y i) և նշենք ռեգրեսիոն ուղիղը:


Նկար 4

Նկար 4-ը ցույց է տալիս, թե ինչպես են դիտարկված արժեքները գտնվում ռեգրեսիոն գծի համեմատ: Y i-ի շեղումները Y i-ից թվային գնահատելու համար, որտեղ y i-ն դիտվող արժեքներն են, իսկ Y i-ը ռեգրեսիայով որոշված ​​արժեքներ են, մենք կկազմենք աղյուսակ.

x i y i Y i Y i -y i
167 169 168.055 -0.945
169 171 170.778 -0.222
170 166 172.140 6.140
170 172 172.140 0.140
172 180 174.863 -5.137
173 176 176.225 0.225
174 177 177.587 0.587
175 182 178.949 -3.051
179 182 184.395 2.395
180 186 185.757 -0.243

Y i արժեքները հաշվարկվում են ըստ ռեգրեսիայի հավասարման:

Որոշ դիտարկվող արժեքների նկատելի շեղումը ռեգրեսիայի գծից բացատրվում է փոքր թվով դիտարկումներով: Y-ի X-ից գծային կախվածության աստիճանն ուսումնասիրելիս հաշվի է առնվում դիտումների քանակը։ Կախվածության ուժը որոշվում է հարաբերակցության գործակցի արժեքով։

Խնդիրը գծային կախվածության գործակիցները գտնելն է, որոնց համար գործում է երկու փոփոխականի ֆունկցիա ԱԵվ բվերցնում է ամենափոքր արժեքը: Այսինքն՝ հաշվի առնելով տվյալները ԱԵվ բԳտնված ուղիղ գծից փորձարարական տվյալների քառակուսի շեղումների գումարը կլինի ամենափոքրը: Սա նվազագույն քառակուսիների մեթոդի ամբողջ իմաստն է:

Այսպիսով, օրինակի լուծումը կրճատվում է երկու փոփոխականների ֆունկցիայի ծայրահեղությունը գտնելով։

Գործակիցներ գտնելու բանաձևերի ստացում.Կազմվում և լուծվում է երկու անհայտ ունեցող երկու հավասարումների համակարգ: Գործառույթների մասնակի ածանցյալների հայտնաբերում ըստ փոփոխականների ԱԵվ բ, այս ածանցյալները հավասարեցնում ենք զրոյի։

Ստացված հավասարումների համակարգը լուծում ենք ցանկացած մեթոդով (օրինակ՝ փոխարինման մեթոդը կամ Կրամերի մեթոդը) և ստանում ենք գործակիցները գտնելու բանաձևեր՝ օգտագործելով նվազագույն քառակուսիների մեթոդը (LSM):

Տվյալներով ԱԵվ բֆունկցիան վերցնում է ամենափոքր արժեքը:

Դա նվազագույն քառակուսիների ամբողջ մեթոդն է: Պարամետրը գտնելու բանաձևը ապարունակում է , , , և պարամետր գումարները n- փորձարարական տվյալների քանակը. Այս գումարների արժեքները խորհուրդ է տրվում հաշվարկել առանձին: Գործակից բհայտնաբերվել է հաշվարկից հետո ա.

Նման բազմանդամների կիրառման հիմնական ոլորտը փորձարարական տվյալների մշակումն է (էմպիրիկ բանաձևերի կառուցումը): Փաստն այն է, որ փորձի օգնությամբ ստացված ֆունկցիայի արժեքներից կառուցված ինտերպոլացիայի բազմանդամը ուժեղ ազդեցություն կունենա «փորձարարական աղմուկի» վրա, ընդ որում, ինտերպոլացիայի ժամանակ ինտերպոլացիոն հանգույցները չեն կարող կրկնվել, այսինքն. դուք չեք կարող օգտագործել կրկնվող փորձերի արդյունքները նույն պայմաններում: Արմատ-միջին քառակուսի բազմանդամը հարթեցնում է աղմուկը և հնարավորություն է տալիս օգտագործել բազմաթիվ փորձերի արդյունքները:

Թվային ինտեգրում և տարբերակում: Օրինակ.

Թվային ինտեգրում- որոշակի ինտեգրալի արժեքի հաշվարկ (որպես կանոն, մոտավոր): Թվային ինտեգրումը հասկացվում է որպես որոշակի ինտեգրալի արժեքը գտնելու թվային մեթոդների մի շարք:

Թվային տարբերակում– Դիսկրետ տրված ֆունկցիայի ածանցյալի արժեքը հաշվարկելու մեթոդների մի շարք:

Ինտեգրում

Խնդրի ձևակերպում.Խնդրի մաթեմատիկական ձևակերպում. անհրաժեշտ է գտնել որոշակի ինտեգրալի արժեքը

որտեղ a, b-ը վերջավոր են, f(x) շարունակական է [а, b]-ում:

Գործնական խնդիրներ լուծելիս հաճախ է պատահում, որ ինտեգրալը անհարմար է կամ անհնար է վերլուծական ընդունել. այն չի կարող արտահայտվել տարրական ֆունկցիաներով, ինտեգրալը կարող է տրվել աղյուսակի տեսքով և այլն: Նման դեպքերում թվային ինտեգրման մեթոդներն են. օգտագործված. Թվային ինտեգրման մեթոդները օգտագործում են կորագիծ տրապիզոնի տարածքի փոխարինումը ավելի պարզ երկրաչափական ձևերի տարածքների վերջավոր գումարով, որը կարելի է ճշգրիտ հաշվարկել: Այս առումով խոսվում է քառակուսային բանաձևերի օգտագործման մասին։

Մեթոդների մեծ մասը օգտագործում է ինտեգրալի ներկայացումը որպես վերջավոր գումար (քառակուսի բանաձև).

Քառակուսային բանաձևերը հիմնված են ինտեգրման ինտերվալի վրա ինտեգրման գրաֆիկը ավելի պարզ ձևի գործառույթներով փոխարինելու գաղափարի վրա, որոնք հեշտությամբ կարող են ինտեգրվել վերլուծական և, հետևաբար, հեշտությամբ հաշվարկվել: Քառակուսային բանաձևերի կառուցման ամենապարզ խնդիրն իրականացվում է բազմանդամ մաթեմատիկական մոդելների համար:

Մեթոդների երեք խումբ կարելի է առանձնացնել.

1. Ինտեգրման հատվածի հավասար ընդմիջումների բաժանման մեթոդ: Ինտերվալների բաժանումը կատարվում է նախօրոք, սովորաբար ինտերվալներն ընտրվում են հավասար (ինտերվալների ծայրերում ֆունկցիայի հաշվարկը հեշտացնելու համար)։ Հաշվիր տարածքները և ամփոփիր դրանք (ուղղանկյունների, տրապիզոիդների, Սիմփսոնի մեթոդները):

2. Ինտեգրման հատվածի բաժանման մեթոդներ հատուկ կետերի միջոցով (Գաուսի մեթոդ):

3. Ինտեգրալների հաշվարկ պատահական թվերով (Մոնտե Կառլոյի մեթոդ):

Ուղղանկյունի մեթոդ.Թող ֆունկցիան (գծագիրը) թվային կերպով ինտեգրվի հատվածի վրա: Հատվածը բաժանում ենք N հավասար ընդմիջումներով։ N կորագծային տրապիզոիդներից յուրաքանչյուրի մակերեսը կարող է փոխարինվել ուղղանկյունի մակերեսով։

Բոլոր ուղղանկյունների լայնությունը նույնն է և հավասար է.

Որպես ուղղանկյունների բարձրության ընտրություն, կարող եք ընտրել ֆունկցիայի արժեքը ձախ եզրագծի վրա: Այս դեպքում առաջին ուղղանկյան բարձրությունը կլինի f(a), երկրորդը՝ f(x 1),…, N-f(N-1):

Եթե ​​որպես ուղղանկյան բարձրության ընտրություն վերցնենք աջ եզրագծի ֆունկցիայի արժեքը, ապա այս դեպքում առաջին ուղղանկյան բարձրությունը կլինի f (x 1), երկրորդը՝ f (x 2), ։ .., N - f (x N):

Ինչպես երևում է, այս դեպքում բանաձևերից մեկը ավելցուկով մոտավորություն է տալիս ինտեգրալին, իսկ երկրորդը՝ թերությամբ։ Կա ևս մեկ միջոց՝ ինտեգրման հատվածի միջնամասում ֆունկցիայի արժեքը օգտագործել մոտարկման համար.

Ուղղանկյունների մեթոդի բացարձակ սխալի գնահատում (միջին)

Ձախ և աջ ուղղանկյունների մեթոդների բացարձակ սխալի գնահատում.

Օրինակ.Հաշվեք ամբողջ ինտերվալի համար և ընդմիջումը բաժանելով չորս հատվածի

Լուծում.Այս ինտեգրալի վերլուծական հաշվարկը տալիս է I=arctg(1)–arctg(0)=0,7853981634: Մեր դեպքում.

1) h = 1; xo = 0; x1 = 1;

2) h = 0,25 (1/4); x0 = 0; x1 = 0,25; x2 = 0,5; x3 = 0,75; x4 = 1;

Մենք հաշվարկում ենք ձախ ուղղանկյունների մեթոդով.

Մենք հաշվարկում ենք ուղղանկյուն ուղղանկյունների մեթոդով.

Հաշվել միջին ուղղանկյունների մեթոդով.

Trapezoidal մեթոդ.Առաջին աստիճանի բազմանդամի օգտագործումը ինտերպոլացիայի համար (ուղիղ գիծ, ​​որը գծված է երկու կետերի միջով) հանգեցնում է trapezoid բանաձևին: Ինտեգրման հատվածի ծայրերը վերցվում են որպես ինտերպոլացիոն հանգույցներ։ Այսպիսով, կորագիծ trapezoid-ը փոխարինվում է սովորական trapezoid-ով, որի մակերեսը կարելի է գտնել որպես հիմքերի գումարի կեսի և բարձրության արտադրյալ:

Բոլոր հանգույցների համար ինտեգրման N հատվածների դեպքում, բացառությամբ հատվածի ծայրահեղ կետերի, ֆունկցիայի արժեքը երկու անգամ կներառվի ընդհանուր գումարի մեջ (քանի որ հարևան trapezoids ունեն մեկ ընդհանուր կողմ)

Trapezoid բանաձևը կարելի է ստանալ՝ վերցնելով հատվածի աջ և ձախ եզրերի երկայնքով ուղղանկյան բանաձևերի գումարի կեսը.

Լուծման կայունության ստուգում:Որպես կանոն, այնքան կարճ է յուրաքանչյուր ինտերվալի երկարությունը, այսինքն. որքան մեծ է այդ ինտերվալների թիվը, այնքան փոքր է տարբերությունը ինտեգրալի մոտավոր և ճշգրիտ արժեքների միջև: Սա ճիշտ է գործառույթների մեծ մասի համար: Trapezoid մեթոդում ϭ ինտեգրալը հաշվարկելիս սխալը մոտավորապես համաչափ է ինտեգրման քայլի քառակուսուն (ϭ ~ h 2): Այսպիսով, a, b սահմաններում որոշակի ֆունկցիայի ինտեգրալը հաշվարկելու համար անհրաժեշտ է. հատվածը բաժանել N 0 միջակայքերի և գտի՛ր տրապիզոնի մակերեսների գումարը: Այնուհետև անհրաժեշտ է ավելացնել N 1 միջակայքերի քանակը, կրկին հաշվարկել տրապիզոնի գումարը և ստացված արժեքը համեմատել նախորդ արդյունքի հետ: Սա պետք է կրկնվի մինչև (N i) մինչև արդյունքի նշված ճշգրտությունը (կոնվերգենցիայի չափանիշ) հասնելը:

Ուղղանկյունի և տրապիզոիդ մեթոդների համար, սովորաբար, կրկնման յուրաքանչյուր քայլում, միջակայքների թիվը մեծանում է 2 գործակցով (N i +1 =2N i):

Կոնվերգենցիայի չափանիշ.

Trapezoid կանոնի հիմնական առավելությունը նրա պարզությունն է: Այնուամենայնիվ, եթե ինտեգրումը պահանջում է բարձր ճշգրտություն, այս մեթոդը կարող է պահանջել չափազանց շատ կրկնություններ:

Trapezoidal մեթոդի բացարձակ սխալգնահատվել է որպես
.

Օրինակ.Հաշվեք մոտավորապես որոշակի ինտեգրալ՝ օգտագործելով trapezoid բանաձևը:

ա) Ինտեգրման հատվածը 3 մասի բաժանելը.
բ) Ինտեգրման հատվածի բաժանումը 5 մասի.

Լուծում:
ա) Ըստ պայմանի, ինտեգրացիոն հատվածը պետք է բաժանվի 3 մասի, այսինքն.
Հաշվեք բաժանման յուրաքանչյուր հատվածի երկարությունը. .

Այսպիսով, trapezoids- ի ընդհանուր բանաձևը կրճատվում է հաճելի չափի.

Վերջապես.

Հիշեցնում եմ, որ ստացված արժեքը տարածքի մոտավոր արժեքն է։

բ) Ինտեգրման հատվածը բաժանում ենք 5 հավասար մասերի, այսինքն՝ . ավելացնելով հատվածների քանակը՝ մենք մեծացնում ենք հաշվարկների ճշգրտությունը։

Եթե ​​, ապա trapezoid բանաձևը ստանում է հետևյալ ձևը.

Եկեք գտնենք բաժանման քայլը.
, այսինքն՝ յուրաքանչյուր միջանկյալ հատվածի երկարությունը 0,6 է։

Առաջադրանքն ավարտելիս հարմար է բոլոր հաշվարկները կազմել հաշվարկային աղյուսակով.

Առաջին տողում գրում ենք «հաշվիչը»

Որպես արդյունք:

Դե պարզաբանում իսկապես կա, այն էլ լուրջ։
Եթե ​​բաժանման 3 հատվածի համար, ապա 5 հատվածի համար: Եթե ​​վերցնեք ավելի շատ հատված => կլինի ավելի ճշգրիտ:

Սիմփսոնի բանաձեւ. Trapezoid բանաձևը տալիս է արդյունք, որը մեծապես կախված է քայլի չափից h, որն ազդում է որոշակի ինտեգրալի հաշվարկի ճշգրտության վրա, հատկապես այն դեպքերում, երբ ֆունկցիան ոչ միապաղաղ է: Կարելի է ենթադրել հաշվարկների ճշգրտության աճ, եթե f(x ֆունկցիայի գրաֆիկի կորագիծ հատվածները փոխարինող ուղիղ գծերի հատվածների փոխարեն օգտագործենք, օրինակ, պարաբոլների բեկորներ, որոնք տրված են գրաֆիկի երեք հարևան կետերով։ . Նմանատիպ երկրաչափական մեկնաբանության հիմքում ընկած է Սիմփսոնի մեթոդը՝ որոշակի ինտեգրալը հաշվարկելու համար։ Ամբողջ ինտեգրման միջակայքը a,b բաժանված է N հատվածների, հատվածի երկարությունը նույնպես հավասար կլինի h=(b-a)/N-ի։

Սիմփսոնի բանաձևը հետևյալն է.

մնացորդային ժամկետ

Սեգմենտների երկարության աճով բանաձևի ճշգրտությունը նվազում է, հետևաբար, ճշգրտությունը մեծացնելու համար օգտագործվում է կոմպոզիտային Simpson բանաձևը: Ամբողջ ինտեգրման միջակայքը բաժանված է զույգ թվով նույնական հատվածների N, հատվածի երկարությունը նույնպես հավասար կլինի h=(b-a)/N-ի։ Սիմփսոնի կոմպոզիտային բանաձևը հետևյալն է.

Բանաձևում փակագծերում արտահայտությունները ինտեգրանի արժեքների գումարներն են, համապատասխանաբար, կենտ և զույգ ներքին հատվածների ծայրերում:

Սիմփսոնի բանաձևի մնացած անդամն արդեն համաչափ է քայլի չորրորդ ուժին.

Օրինակ:Հաշվիր ինտեգրալը՝ օգտագործելով Սիմփսոնի կանոնը։ (Ճշգրիտ լուծում - 0.2)

Գաուսի մեթոդ

Գաուսի քառակուսային բանաձևը. Երկրորդ սորտի քառակուսային բանաձևերի հիմնական սկզբունքը տեսանելի է Նկար 1.12-ից. անհրաժեշտ է կետերը տեղադրել այնպես. X 0 և X 1 հատվածի ներսում [ ա;բ] այնպես, որ «եռանկյունների» մակերեսներն ընդհանուր առմամբ հավասար լինեն «հատվածի» մակերեսներին։ Գաուսի բանաձևն օգտագործելիս սկզբնական հատվածը [ ա;բ]-ը կրճատվում է մինչև [-1;1] միջակայքը՝ փոխելով փոփոխականը Xվրա

0.5∙(բա)∙տ+ 0.5∙(բ + ա).

Հետո , Որտեղ .

Այս փոխարինումը հնարավոր է, եթե աԵվ բվերջավոր են, իսկ ֆունկցիան զ(x) շարունակական է [ ա;բ]։ Գաուսի բանաձևը nմիավորներ x i, ես=0,1,..,n-1 հատվածի ներսում [ ա;բ]:

, (1.27)

Որտեղ t iԵվ A iզանազանի համար nտրված են տեղեկատու գրքերում: Օրինակ, երբ n=2 Ա 0 =Ա 1=1; ժամը n=3: տ 0 =t 2" 0.775, տ 1 =0, Ա 0 2" 0.555, Ա 1" 0,889.

Գաուսի քառակուսային բանաձևը

ստացված մեկին հավասար քաշի ֆունկցիայով p(x)= 1 և հանգույցներ x i, որոնք Լեժանդրի բազմանդամների արմատներն են

Հնարավորություններ A iհեշտությամբ հաշվարկվում է բանաձևերով

ես=0,1,2,...n.

Հանգույցների և գործակիցների արժեքները n=2,3,4,5-ի համար տրված են աղյուսակում.

Պատվեր Հանգույցներ Հնարավորություններ
n=2 x 1=0 x 0 =-x2=0.7745966692 Ա 1=8/9 A 0 = A 2=5/9
n=3 x 2 =-x 1=0.3399810436 x 3 =-x0=0.8611363116 A 1 = A 2=0.6521451549 A 0 = A 3=0.6521451549
n=4 x 2 = 0 x 3 = -x 1 = 0.5384693101 x 4 =-x 0 =0.9061798459 Ա 0 =0.568888899 Ա 3 =Ա 1 =0.4786286705 Ա 0 =Ա 4 =0.2869268851
n=5 x 5 = -x 0 =0.9324695142 x 4 = -x 1 =0.6612093865 x 3 = -x 2 =0.2386191861 Ա 5 0 =0.1713244924 Ա 4 1 =0.3607615730 Ա 3 2 =0.4679139346

Օրինակ.Հաշվեք արժեքը՝ օգտագործելով Գաուսի բանաձևը n=2:

Ճշգրիտ արժեք: .

Գաուսի բանաձևով ինտեգրալը հաշվարկելու ալգորիթմը նախատեսում է ոչ թե կրկնապատկել միկրոսեգմենտների քանակը, այլ օրդինատների քանակը 1-ով ավելացնել և համեմատել ինտեգրալի ստացված արժեքները: Գաուսի բանաձեւի առավելությունը բարձր ճշգրտությունն է՝ համեմատաբար փոքր թվով օրդինատներով։ Թերությունները՝ անհարմար է ձեռքով հաշվարկների համար; պետք է պահվի համակարգչի հիշողության մեջ t i, A iզանազանության համար n.

Գաուսի քառակուսային բանաձևի սխալը հատվածի վրա կլինի միևնույն ժամանակ: Մնացած անդամի բանաձևը կլինի այնտեղ, որտեղ α գործակիցը Նաճի հետ արագ նվազում է Ն. Այստեղ

Գաուսի բանաձևերը բարձր ճշգրտություն են ապահովում արդեն փոքր թվով հանգույցների դեպքում (4-ից մինչև 10):Այս դեպքում գործնական հաշվարկներում հանգույցների թիվը տատանվում է մի քանի հարյուրից մինչև մի քանի հազար: Մենք նաև նշում ենք, որ Գաուսի քառակուսիների կշիռները միշտ դրական են, ինչը ապահովում է գումարների հաշվարկման ալգորիթմի կայունությունը.

Վերև