رگرسیون خطی. با استفاده از روش حداقل مربعات (LSM). تقریب داده های تجربی. روش حداقل مربعات روش حداقل مربعات در مورد 3 متغیر

که گسترده ترین کاربرد را در زمینه های مختلف علمی و عملی می یابد. این می تواند فیزیک، شیمی، زیست شناسی، اقتصاد، جامعه شناسی، روانشناسی و غیره و غیره باشد. به خواست سرنوشت، من اغلب باید با اقتصاد سر و کار داشته باشم، و بنابراین امروز برای شما بلیط یک کشور شگفت انگیز به نام اقتصاد سنجی=) ... چطور این را نمی خواهی؟! آنجا خیلی خوب است - فقط باید تصمیم بگیرید! ... اما چیزی که احتمالاً قطعاً می خواهید این است که یاد بگیرید چگونه مشکلات را حل کنید کمترین مربعات. و به خصوص خوانندگان سخت کوش یاد خواهند گرفت که آنها را نه تنها به طور دقیق، بلکه بسیار سریع نیز حل کنند ;-) اما ابتدا بیان کلی مشکل+ مثال مرتبط:

اجازه دهید شاخص هایی در برخی از حوزه های موضوعی مورد مطالعه قرار گیرند که بیان کمی دارند. در عین حال، دلایل زیادی برای این باور وجود دارد که شاخص به شاخص بستگی دارد. این فرض هم می تواند یک فرضیه علمی باشد و هم بر اساس عقل سلیم ابتدایی. با این حال، بیایید علم را کنار بگذاریم و مناطق اشتها آورتر - یعنی فروشگاه های مواد غذایی - را بررسی کنیم. نشان دادن با:

- فضای خرده فروشی یک فروشگاه مواد غذایی، متر مربع،
- گردش مالی سالانه یک فروشگاه مواد غذایی، میلیون روبل.

کاملاً واضح است که هر چه مساحت فروشگاه بزرگتر باشد، در اکثر موارد گردش مالی آن بیشتر است.

فرض کنید پس از انجام مشاهدات / آزمایش / محاسبات / رقصیدن با تنبور، داده های عددی در اختیار داریم:

در مورد فروشگاه های مواد غذایی، فکر می کنم همه چیز روشن است: - این منطقه اولین فروشگاه است، - گردش مالی سالانه آن، - منطقه فروشگاه دوم، - گردش مالی سالانه آن و غیره. به هر حال ، دسترسی به مواد طبقه بندی شده اصلاً ضروری نیست - ارزیابی نسبتاً دقیقی از گردش مالی را می توان با استفاده از آمار ریاضی. با این حال، منحرف نشوید، دوره جاسوسی تجاری قبلاً پرداخت شده است =)

داده های جدولی را نیز می توان به صورت نقطه ای نوشت و به روش معمول برای ما ترسیم کرد. سیستم دکارتی .

بیایید به یک سوال مهم پاسخ دهیم: برای یک مطالعه کیفی چند امتیاز لازم است؟

هرچه بزرگتر بهتر. حداقل مجموعه قابل قبول شامل 5-6 امتیاز است. علاوه بر این، با مقدار کمی داده، نتایج "غیر طبیعی" نباید در نمونه گنجانده شود. بنابراین، برای مثال، یک فروشگاه کوچک نخبه می‌تواند بیشتر از «همکاران خود» به سفارش‌های بزرگ کمک کند، در نتیجه الگوی کلی را که باید پیدا کرد، مخدوش می‌کند!

اگر خیلی ساده است، باید یک تابع را انتخاب کنیم، برنامهکه تا حد امکان نزدیک به نقاط می گذرد . چنین تابعی نامیده می شود تقریبی (تقریبی - تقریبی)یا عملکرد نظری . به طور کلی، در اینجا بلافاصله یک "مدعی" آشکار ظاهر می شود - یک چند جمله ای با درجه بالا، که نمودار آن از تمام نقاط عبور می کند. اما این گزینه پیچیده است و اغلب به سادگی نادرست است. (زیرا نمودار همیشه "باد" می شود و روند اصلی را به خوبی منعکس می کند).

بنابراین، تابع مورد نظر باید به اندازه کافی ساده باشد و در عین حال وابستگی را به اندازه کافی منعکس کند. همانطور که ممکن است حدس بزنید، یکی از روش های یافتن چنین توابعی نامیده می شود کمترین مربعات. ابتدا اجازه دهید ماهیت آن را به صورت کلی تحلیل کنیم. اجازه دهید برخی از تابع ها به داده های تجربی تقریب داشته باشند:


چگونه می توان صحت این تقریب را ارزیابی کرد؟ اجازه دهید تفاوت (انحرافات) بین مقادیر تجربی و عملکردی را نیز محاسبه کنیم (ما نقاشی را مطالعه می کنیم). اولین فکری که به ذهن خطور می کند این است که مقدار مجموع را تخمین بزنیم، اما مشکل اینجاست که تفاوت ها می تواند منفی باشد. (مثلا، ) و انحرافات در نتیجه چنین جمع آوری یکدیگر را خنثی می کنند. بنابراین، به عنوان تخمینی از دقت تقریب، خود را پیشنهاد می کند که مجموع را بگیرد ماژول هاانحرافات:

یا به صورت تا شده: (ناگهان، کسی که نمی داند: نماد جمع است و یک متغیر کمکی است - "counter" که مقادیری از 1 تا را می گیرد).

با تقریب نقاط آزمایشی با توابع مختلف مقادیر متفاوتی از را بدست می آوریم و بدیهی است که در جایی که این مجموع کوچکتر است آن تابع دقت بیشتری دارد.

چنین روشی وجود دارد و نامیده می شود روش حداقل مدول. با این حال، در عمل بسیار گسترده تر شده است. روش حداقل مربع، که در آن مقادیر منفی احتمالی نه با مدول، بلکه با مربع کردن انحرافات حذف می شوند:

، پس از آن تلاش ها برای انتخاب چنین تابعی است که مجموع انحرافات مجذور تا حد امکان کوچک بود در واقع، از این رو نام روش است.

و اکنون به یک نکته مهم دیگر باز می گردیم: همانطور که در بالا ذکر شد، تابع انتخاب شده باید کاملاً ساده باشد - اما بسیاری از توابع از این دست نیز وجود دارد: خطی , هذلولی, نمایی, لگاریتمی, درجه دوم و غیره. و البته در اینجا بلافاصله می خواهم "زمینه فعالیت را کاهش دهم." کدام دسته از کارکردها را برای تحقیق انتخاب کنیم؟ تکنیک ابتدایی اما موثر:

- ساده ترین راه برای رسم امتیاز بر روی نقاشی و تجزیه و تحلیل مکان آنها. اگر آنها تمایل دارند در یک خط مستقیم باشند، پس باید به دنبال آن باشید معادله خط مستقیم با مقادیر بهینه و . به عبارت دیگر، وظیفه یافتن چنین ضرایبی است - به طوری که مجموع انحرافات مجذور کوچکترین باشد.

اگر نقاط، به عنوان مثال، در امتداد قرار دارند هذلولی، پس واضح است که تابع خطی تقریب ضعیفی به دست می دهد. در این مورد، ما به دنبال «مطلوب ترین» ضرایب برای معادله هذلولی هستیم - آنهایی که حداقل مجموع مربع ها را می دهند .

حال توجه کنید که در هر دو مورد صحبت می کنیم توابع دو متغیر، که استدلال های آن است گزینه های وابستگی را جستجو کرد:

و در اصل، ما باید یک مشکل استاندارد را حل کنیم - پیدا کنیم حداقل یک تابع از دو متغیر.

مثال ما را به یاد بیاورید: فرض کنید که نقاط "فروشگاه" در یک خط مستقیم قرار دارند و هر دلیلی برای باور وجود وجود دارد. وابستگی خطیگردش مالی از منطقه تجاری بیایید چنین ضرایبی "a" و "be" را پیدا کنیم تا مجذور انحرافات کوچکترین بود همه چیز طبق معمول - اول مشتقات جزئی از مرتبه 1. مطابق با قانون خطی بودنمی توانید درست در زیر نماد جمع متمایز کنید:

اگر می خواهید از این اطلاعات برای یک مقاله یا یک مقاله ترم استفاده کنید، از پیوند موجود در لیست منابع بسیار سپاسگزار خواهم بود، چنین محاسبات دقیقی را در هیچ کجا پیدا نمی کنید:

بیایید یک سیستم استاندارد بسازیم:

هر معادله را یک "دو" کاهش می دهیم و علاوه بر این، مجموع را "از هم جدا می کنیم":

توجه داشته باشید : به طور مستقل تجزیه و تحلیل کنید که چرا می توان "a" و "be" را از نماد جمع خارج کرد. به هر حال، به طور رسمی این را می توان با مجموع انجام داد

بیایید سیستم را به شکل "کاربردی" بازنویسی کنیم:

پس از آن الگوریتم حل مسئله ما شروع به ترسیم می کند:

آیا مختصات نقاط را می دانیم؟ ما میدانیم. مبالغ می توانیم پیدا کنیم؟ به آسانی. ما ساده ترین ها را می سازیم سیستم دو معادله خطی با دو مجهول(«الف» و «به»). ما سیستم را حل می کنیم، به عنوان مثال، روش کرامر، منجر به یک نقطه ثابت می شود. چک کردن شرایط کافی برای یک افراطی، می توانیم تأیید کنیم که در این مرحله تابع دقیقا می رسد کمترین. تأیید با محاسبات اضافی همراه است و بنابراین ما آن را در پشت صحنه رها می کنیم. (در صورت لزوم، قاب گم شده قابل مشاهده است). نتیجه نهایی را می گیریم:

تابع بهترین راه (حداقل در مقایسه با هر تابع خطی دیگری)نقاط تجربی را به هم نزدیک می کند . به طور کلی، نمودار آن تا حد ممکن به این نقاط نزدیک می شود. در سنت اقتصاد سنجیتابع تقریبی حاصل نیز نامیده می شود معادله رگرسیون خطی زوجی .

مسئله مورد بررسی اهمیت عملی زیادی دارد. در وضعیت مثال ما، معادله به شما اجازه می دهد تا نوع گردش مالی را پیش بینی کنید ("یگ")در فروشگاه با یک یا مقدار دیگری از منطقه فروش خواهد بود (یک یا یک معنی دیگر از "x"). بله، پیش‌بینی حاصل تنها یک پیش‌بینی خواهد بود، اما در بسیاری از موارد کاملاً دقیق خواهد بود.

من فقط یک مشکل را با اعداد "واقعی" تجزیه و تحلیل می کنم ، زیرا هیچ مشکلی در آن وجود ندارد - همه محاسبات در سطح برنامه درسی مدرسه در کلاس های 7-8 است. در 95 درصد موارد، از شما خواسته می شود که فقط یک تابع خطی را پیدا کنید، اما در انتهای مقاله نشان خواهم داد که یافتن معادلات هذلولی بهینه، توان و برخی توابع دیگر دشوارتر نیست.

در واقع، توزیع خوبی های وعده داده شده باقی مانده است - به طوری که یاد بگیرید چگونه چنین نمونه هایی را نه تنها با دقت، بلکه به سرعت حل کنید. ما استاندارد را به دقت مطالعه می کنیم:

وظیفه

در نتیجه مطالعه رابطه بین دو شاخص، جفت اعداد زیر به دست آمد:

با استفاده از روش حداقل مربعات، تابع خطی را که بهترین تقریب تجربی را دارد، پیدا کنید (با تجربه)داده ها. یک نقاشی بکشید که در یک سیستم مختصات مستطیلی دکارتی، نقاط آزمایشی و نموداری از تابع تقریبی را ترسیم کنید. . مجموع مجذور انحرافات بین مقادیر تجربی و نظری را بیابید. ببینید آیا عملکرد بهتر است یا خیر (از نظر روش حداقل مربعات)نقاط آزمایشی تقریبی

توجه داشته باشید که مقادیر "x" مقادیر طبیعی هستند و این یک معنای معنی دار مشخصه دارد که کمی بعد در مورد آن صحبت خواهم کرد. اما آنها، البته، می توانند کسری باشند. علاوه بر این، بسته به محتوای یک کار خاص، هر دو مقدار "X" و "G" می توانند به طور کامل یا تا حدی منفی باشند. خوب، به ما یک وظیفه "بی چهره" داده شده است و ما آن را شروع می کنیم راه حل:

ما ضرایب تابع بهینه را به عنوان یک راه حل برای سیستم پیدا می کنیم:

برای یک نماد فشرده تر، می توان متغیر "counter" را حذف کرد، زیرا از قبل مشخص است که جمع بندی از 1 تا .

محاسبه مقادیر مورد نیاز به صورت جدولی راحت تر است:


محاسبات را می توان بر روی یک ریز ماشین حساب انجام داد، اما استفاده از Excel بسیار بهتر است - هم سریعتر و هم بدون خطا. تماشای یک ویدیوی کوتاه:

بنابراین، موارد زیر را بدست می آوریم سیستم:

در اینجا می توانید معادله دوم را در 3 ضرب کنید و عدد 2 را از معادله 1 کم کنید. اما این شانس است - در عمل، سیستم ها اغلب با استعداد نیستند و در چنین مواردی باعث صرفه جویی می شود روش کرامر:
، بنابراین سیستم یک راه حل منحصر به فرد دارد.

بیا چک کنیم می‌دانم که نمی‌خواهم، اما چرا از اشتباهاتی که نمی‌توانی آنها را از دست ندهی، بگذریم؟ جواب پیدا شده را در سمت چپ هر معادله سیستم جایگزین کنید:

قسمت های مناسب معادلات مربوطه به دست می آید، یعنی سیستم به درستی حل شده است.

بنابراین، تابع تقریبی مورد نظر: – از همه توابع خطیداده های تجربی به بهترین وجه توسط آن تقریب می شوند.

بر خلاف سر راست وابستگی گردش مالی فروشگاه به منطقه آن، وابستگی یافت شده است معکوس (اصل "هرچه بیشتر - کمتر")، و این واقعیت بلافاصله توسط منفی آشکار می شود ضریب زاویه ای. تابع به ما اطلاع می دهد که با افزایش 1 واحد در یک شاخص خاص، مقدار اندیکاتور وابسته کاهش می یابد میانگین 0.65 واحد همانطور که می گویند، هر چه قیمت گندم سیاه بیشتر باشد، کمتر فروخته می شود.

برای رسم تابع تقریبی، دو مقدار از آن را پیدا می کنیم:

و نقشه را اجرا کنید:


خط ساخته شده نامیده می شود خط روند (یعنی یک خط روند خطی، یعنی در حالت کلی، یک روند لزوما یک خط مستقیم نیست). همه با تعبیر "در ترند بودن" آشنا هستند و فکر می کنم این اصطلاح نیاز به توضیح اضافی ندارد.

مجموع انحرافات مجذور را محاسبه کنید بین ارزش های تجربی و نظری از نظر هندسی، این مجموع مجذور طول قطعات "زرشکی" است (دوتا از آنها آنقدر کوچک هستند که حتی نمی توانید آنها را ببینید).

بیایید محاسبات را در یک جدول خلاصه کنیم:


آنها دوباره می توانند به صورت دستی انجام شوند، فقط در صورتی که برای نکته 1 مثالی بزنم:

اما انجام روشی که قبلاً شناخته شده است بسیار کارآمدتر است:

تکرار کنیم: منظور از نتیجه چیست؟از جانب همه توابع خطیتابع توان کوچکترین است، یعنی بهترین تقریب در خانواده خود است. و در اینجا، اتفاقاً، سؤال نهایی مسئله تصادفی نیست: اگر تابع نمایی پیشنهادی چه می‌شود؟ آیا بهتر است نقاط تجربی را تقریب کنیم؟

بیایید مجموع متناظر انحرافات مربع را پیدا کنیم - برای تشخیص آنها، آنها را با حرف "epsilon" مشخص می کنم. تکنیک دقیقاً مشابه است:


و دوباره برای هر محاسبه آتش برای نقطه 1:

در اکسل از تابع استاندارد استفاده می کنیم انقضا (سینتکس را می توان در راهنمای اکسل یافت).

نتیجه: بنابراین تابع نمایی نقاط آزمایشی را بدتر از خط مستقیم تقریب می کند .

اما در اینجا باید توجه داشت که «بدتر» است هنوز به این معنی نیست، چه اشکالی دارد. اکنون من یک نمودار از این تابع نمایی ساختم - و همچنین نزدیک به نقاط عبور می کند - به حدی که بدون مطالعه تحلیلی نمی توان گفت کدام تابع دقیق تر است.

این راه حل را کامل می کند و من به سؤال ارزش های طبیعی استدلال برمی گردم. در مطالعات مختلف، به طور معمول، اقتصادی یا جامعه شناختی، ماه ها، سال ها یا سایر فواصل زمانی مساوی با "X" طبیعی شماره گذاری می شوند. به عنوان مثال، چنین مشکلی را در نظر بگیرید.

مثال.

داده های تجربی در مورد مقادیر متغیرها ایکسو دردر جدول آورده شده است.

در نتیجه تراز آنها، تابع

استفاده كردن روش حداقل مربع، این داده ها را با یک وابستگی خطی تقریبی کنید y=ax+b(گزینه ها را پیدا کنید آو ب). دریابید که کدام یک از دو خط بهتر است (به معنای روش حداقل مربعات) داده های تجربی را تراز می کند. یک نقاشی بکشید.

ماهیت روش حداقل مربعات (LSM).

مشکل پیدا کردن ضرایب وابستگی خطی است که برای آنها تابع دو متغیر است آو ب کمترین مقدار را می گیرد. یعنی با توجه به داده ها آو بمجموع انحرافات مجذور داده های تجربی از خط مستقیم یافت شده کوچکترین خواهد بود. این نکته کل روش حداقل مربعات است.

بنابراین، حل مثال به یافتن حد فاصل یک تابع از دو متغیر خلاصه می شود.

استخراج فرمول برای یافتن ضرایب.

یک سیستم دو معادله با دو مجهول گردآوری و حل می شود. یافتن مشتقات جزئی توابع توسط متغیرها آو ب، این مشتقات را با صفر برابر می کنیم.

ما سیستم معادلات حاصل را با هر روشی حل می کنیم (مثلا روش تعویضیا روش کرامر) و فرمول های یافتن ضرایب را با استفاده از روش حداقل مربعات (LSM) بدست آورید.

با داده آو بتابع کمترین مقدار را می گیرد. دلیل این واقعیت ارائه شده است زیر متن انتهای صفحه.

این کل روش حداقل مربعات است. فرمول برای یافتن پارامتر آشامل مجموع،،، و پارامتر است n- مقدار داده های تجربی مقادیر این مبالغ توصیه می شود به طور جداگانه محاسبه شوند. ضریب ببعد از محاسبه پیدا شد آ.

وقت آن است که نمونه اصلی را به خاطر بسپارید.

راه حل.

در مثال ما n=5. برای راحتی محاسبه مقادیری که در فرمول های ضرایب مورد نیاز گنجانده شده است، جدول را پر می کنیم.

مقادیر سطر چهارم جدول با ضرب مقادیر سطر دوم در مقادیر سطر 3 برای هر عدد به دست می آید. من.

مقادیر ردیف پنجم جدول با مجذور کردن مقادیر سطر دوم برای هر عدد به دست می آید. من.

مقادیر آخرین ستون جدول مجموع مقادیر در سراسر سطرها است.

برای یافتن ضرایب از فرمول روش حداقل مربعات استفاده می کنیم آو ب. ما مقادیر مربوطه را از آخرین ستون جدول در آنها جایگزین می کنیم:

از این رو، y=0.165x+2.184خط مستقیم تقریبی مورد نظر است.

باقی مانده است که بفهمیم کدام یک از خطوط y=0.165x+2.184یا داده های اصلی را بهتر تقریب می کند، یعنی تخمینی را با استفاده از روش حداقل مربعات انجام می دهد.

برآورد خطای روش حداقل مربعات.

برای انجام این کار، باید مجموع انحرافات مجذور داده های اصلی را از این خطوط محاسبه کنید و ، یک مقدار کوچکتر مربوط به خطی است که از نظر روش حداقل مربعات، داده های اصلی را بهتر تقریب می کند.

از آن زمان، پس از آن خط y=0.165x+2.184داده های اصلی را بهتر تقریب می کند.

تصویر گرافیکی روش حداقل مربعات (LSM).

همه چیز در نمودارها عالی به نظر می رسد. خط قرمز همان خط یافت شده است y=0.165x+2.184، خط آبی است ، نقاط صورتی داده های اصلی هستند.

در عمل، هنگام مدل‌سازی فرآیندهای مختلف - به ویژه اقتصادی، فیزیکی، فنی، اجتماعی - از یک یا روش دیگری برای محاسبه مقادیر تقریبی توابع از مقادیر شناخته شده آنها در برخی از نقاط ثابت استفاده می‌شود.

مشکلات تقریب توابع از این نوع اغلب ایجاد می شود:

    هنگام ساخت فرمول های تقریبی برای محاسبه مقادیر مقادیر مشخصه فرآیند مورد مطالعه با توجه به داده های جدولی به دست آمده در نتیجه آزمایش.

    در ادغام عددی، تمایز، حل معادلات دیفرانسیل و غیره؛

    در صورت نیاز به محاسبه مقادیر توابع در نقاط میانی بازه در نظر گرفته شده؛

    هنگام تعیین مقادیر مقادیر مشخصه فرآیند در خارج از فاصله مورد نظر، به ویژه هنگام پیش بینی.

اگر برای مدل‌سازی یک فرآیند مشخص که توسط جدول مشخص شده است، تابعی ساخته شود که تقریباً این فرآیند را بر اساس روش حداقل مربعات توصیف می‌کند، آن را تابع تقریبی (رگرسیون) می‌نامند و وظیفه ساخت توابع تقریبی خود را انجام می‌دهد. یک مشکل تقریبی باشد

این مقاله امکانات بسته MS Excel را برای حل چنین مشکلاتی مورد بحث قرار می دهد، علاوه بر این، روش ها و تکنیک هایی برای ساخت (ایجاد) رگرسیون برای توابع داده شده به صورت جدولی (که اساس تحلیل رگرسیون است) ارائه شده است.

دو گزینه برای ایجاد رگرسیون در اکسل وجود دارد.

    افزودن رگرسیون های انتخابی (خطوط روند) به نمودار ساخته شده بر اساس جدول داده برای مشخصه فرآیند مورد مطالعه (فقط در صورت ایجاد نمودار موجود است).

    با استفاده از توابع آماری داخلی کاربرگ اکسل، که به شما امکان می دهد رگرسیون ها (خطوط روند) را مستقیماً از جدول داده های منبع دریافت کنید.

افزودن خطوط روند به نمودار

برای جدولی از داده‌ها که یک فرآیند خاص را توصیف می‌کند و با یک نمودار نشان داده می‌شود، اکسل یک ابزار تحلیل رگرسیون موثر دارد که به شما امکان می‌دهد:

    بر اساس روش حداقل مربعات بسازید و پنج نوع رگرسیون را به نمودار اضافه کنید که فرآیند مورد مطالعه را با درجات مختلف دقت مدل می کند.

    معادله رگرسیون ساخته شده را به نمودار اضافه کنید.

    میزان انطباق رگرسیون انتخاب شده با داده های نمایش داده شده در نمودار را تعیین کنید.

بر اساس داده‌های نمودار، اکسل به شما امکان می‌دهد انواع رگرسیون‌های خطی، چند جمله‌ای، لگاریتمی، نمایی، نمایی را دریافت کنید که با معادله ارائه می‌شوند:

y = y(x)

که در آن x یک متغیر مستقل است که اغلب مقادیر دنباله‌ای از اعداد طبیعی (1؛ 2؛ 3؛ ...) را می‌گیرد و برای مثال، شمارش معکوس زمان فرآیند مورد مطالعه (ویژگی‌ها) را تولید می‌کند. .

1 . رگرسیون خطی در مدل‌سازی ویژگی‌هایی که با نرخ ثابت افزایش یا کاهش می‌یابند خوب است. این ساده ترین مدل فرآیند مورد مطالعه است. بر اساس معادله ساخته شده است:

y=mx+b

که در آن m مماس شیب رگرسیون خطی بر محور x است. ب - مختصات نقطه تقاطع رگرسیون خطی با محور y.

2 . خط روند چند جمله ای برای توصیف ویژگی هایی مفید است که دارای چندین حد متمایز (بالا و پایین) هستند. انتخاب درجه چند جمله ای با تعداد اکسترم های مشخصه مورد مطالعه تعیین می شود. بنابراین، یک چند جمله ای درجه دوم به خوبی می تواند فرآیندی را توصیف کند که تنها یک حداکثر یا حداقل دارد. چند جمله ای درجه سوم - بیش از دو انتها. چند جمله ای درجه چهارم - بیش از سه انتها و غیره نیست.

در این مورد، خط روند مطابق با معادله ساخته می شود:

y = c0 + c1x + c2x2 + c3x3 + c4x4 + c5x5 + c6x6

که در آن ضرایب c0, c1, c2,...c6 ثابت هایی هستند که مقادیر آنها در حین ساخت تعیین می شود.

3 . خط روند لگاریتمی با موفقیت در ویژگی های مدل سازی استفاده می شود که مقادیر آن ابتدا به سرعت تغییر می کند و سپس به تدریج تثبیت می شود.

y = c ln(x) + b

4 . خط روند قدرت نتایج خوبی به دست می دهد اگر مقادیر وابستگی مورد مطالعه با تغییر ثابت در نرخ رشد مشخص شود. نمونه ای از چنین وابستگی می تواند به عنوان نمودار حرکت شتاب یکنواخت ماشین عمل کند. اگر مقادیر صفر یا منفی در داده ها وجود داشته باشد، نمی توانید از خط روند برق استفاده کنید.

مطابق با معادله ساخته شده است:

y = cxb

که در آن ضرایب b و c ثابت هستند.

5 . اگر نرخ تغییر در داده ها به طور مداوم در حال افزایش باشد، باید از خط روند نمایی استفاده شود. برای داده های حاوی مقادیر صفر یا منفی، این نوع تقریب نیز قابل اجرا نیست.

مطابق با معادله ساخته شده است:

y=cebx

که در آن ضرایب b و c ثابت هستند.

هنگام انتخاب یک خط روند، اکسل به طور خودکار مقدار R2 را محاسبه می کند، که دقت تقریب را مشخص می کند: هر چه مقدار R2 به یک نزدیکتر باشد، خط روند با اطمینان بیشتری به فرآیند مورد مطالعه تقریب می کند. در صورت لزوم، مقدار R2 همیشه می تواند بر روی نمودار نمایش داده شود.

با فرمول تعیین می شود:

برای افزودن خط روند به یک سری داده:

    نمودار ساخته شده بر اساس سری داده ها را فعال کنید، یعنی در ناحیه نمودار کلیک کنید. مورد نمودار در منوی اصلی ظاهر می شود.

    پس از کلیک بر روی این مورد، منویی روی صفحه ظاهر می شود که در آن باید دستور Add trend line را انتخاب کنید.

اگر ماوس را روی نمودار مربوط به یکی از سری داده ها نگه دارید و راست کلیک کنید، همان اقدامات به راحتی انجام می شود. در منوی زمینه ظاهر شده، دستور Add trend line را انتخاب کنید. کادر محاوره‌ای Trendline با باز شدن تب Type روی صفحه ظاهر می‌شود (شکل 1).

پس از آن شما نیاز دارید:

در تب Type، نوع خط روند مورد نیاز را انتخاب کنید (خطی به طور پیش فرض انتخاب شده است). برای نوع Polynomial در قسمت Degree درجه چند جمله ای انتخاب شده را مشخص کنید.

1 . فیلد Built on Series تمام سری های داده را در نمودار مورد نظر فهرست می کند. برای افزودن خط روند به یک سری داده خاص، نام آن را در قسمت Built on series انتخاب کنید.

در صورت لزوم با رفتن به تب Parameters (شکل 2) می توانید پارامترهای زیر را برای خط روند تنظیم کنید:

    نام خط روند را در نام فیلد منحنی تقریبی (صاف) تغییر دهید.

    تعداد دوره ها (به جلو یا عقب) را برای پیش بینی در قسمت Forecast تنظیم کنید.

    معادله خط روند را در ناحیه نمودار نمایش دهید، که برای آن باید چک باکس نمایش معادله در نمودار را فعال کنید.

    مقدار قابلیت اطمینان تقریبی R2 را در ناحیه نمودار نمایش دهید، که برای آن باید چک باکس را فعال کنید و مقدار قابلیت اطمینان تقریبی (R^2) را روی نمودار قرار دهید.

    نقطه تقاطع خط روند را با محور Y تنظیم کنید، که برای آن باید چک باکس را برای تقاطع منحنی با محور Y در یک نقطه فعال کنید.

    روی دکمه OK کلیک کنید تا کادر محاوره ای بسته شود.

سه راه برای شروع ویرایش خط روند از قبل ساخته شده وجود دارد:

    پس از انتخاب خط روند، از دستور Selected trend line از منوی Format استفاده کنید.

    دستور Format Trendline را از منوی زمینه انتخاب کنید که با کلیک راست روی خط روند فراخوانی می شود.

    با دوبار کلیک کردن روی خط روند.

کادر محاوره‌ای Format Trendline بر روی صفحه ظاهر می‌شود (شکل 3)، که شامل سه زبانه است: View، Type، Parameters، و محتویات دو مورد آخر کاملاً با زبانه‌های مشابه کادر گفتگوی Trendline مطابقت دارد (شکل 1-2). ). در تب View می توانید نوع خط، رنگ و ضخامت آن را تعیین کنید.

برای حذف یک خط روند از قبل ساخته شده، خط روندی که باید حذف شود را انتخاب کنید و کلید Delete را فشار دهید.

مزایای ابزار تحلیل رگرسیون در نظر گرفته شده عبارتند از:

    سهولت نسبی ترسیم خط روند روی نمودارها بدون ایجاد جدول داده برای آن؛

    فهرست نسبتاً گسترده ای از انواع خطوط روند پیشنهادی، و این فهرست شامل رایج ترین انواع رگرسیون است.

    امکان پیش بینی رفتار فرآیند مورد مطالعه برای تعداد دلخواه (در حد عقل سلیم) گام به جلو و همچنین عقب.

    امکان به دست آوردن معادله خط روند به صورت تحلیلی؛

    امکان به دست آوردن یک ارزیابی از قابلیت اطمینان تقریب، در صورت لزوم.

از معایب می توان به نکات زیر اشاره کرد:

    ساخت یک خط روند تنها در صورتی انجام می شود که نموداری بر اساس یک سری داده وجود داشته باشد.

    فرآیند تولید سری داده برای مشخصه مورد مطالعه بر اساس معادلات خط روند به دست آمده برای آن تا حدودی درهم و برهم است: معادلات رگرسیون مورد نظر با هر تغییر در مقادیر سری داده های اصلی، اما فقط در محدوده نمودار به روز می شوند. ، در حالی که سری داده های تشکیل شده بر اساس روند معادله خط قدیمی، بدون تغییر باقی می ماند.

    در گزارش‌های PivotChart، زمانی که نمای نمودار یا گزارش PivotTable مرتبط را تغییر می‌دهید، خطوط روند موجود حفظ نمی‌شوند، بنابراین باید قبل از ترسیم خطوط روند یا فرمت‌بندی گزارش PivotChart، مطمئن شوید که چیدمان گزارش با الزامات شما مطابقت دارد.

خطوط روند را می توان به مجموعه داده های ارائه شده در نمودارهایی مانند نمودار، هیستوگرام، نمودارهای مسطح غیر عادی شده، نوار، پراکندگی، حباب و نمودارهای سهام اضافه کرد.

شما نمی توانید خطوط روند را به سری های داده در نمودارهای 3-D، Standard، Radar، Pie و Donut اضافه کنید.

استفاده از توابع داخلی اکسل

اکسل همچنین یک ابزار تجزیه و تحلیل رگرسیون برای رسم خطوط روند خارج از منطقه نمودار ارائه می دهد. تعدادی از توابع کاربرگ آماری را می توان برای این منظور استفاده کرد، اما همه آنها به شما امکان می دهند فقط رگرسیون های خطی یا نمایی بسازید.

اکسل چندین توابع برای ایجاد رگرسیون خطی دارد، به ویژه:

    روند؛

  • SLOPE و CUT.

و همچنین چندین تابع برای ساخت یک خط روند نمایی، به ویژه:

    LGRFPحدود

لازم به ذکر است که تکنیک های ساخت رگرسیون با استفاده از توابع TREND و GROWTH عملاً یکسان است. همین را می توان در مورد جفت توابع LINEST و LGRFPRIBL گفت. برای این چهار تابع، هنگام ایجاد جدول مقادیر، از ویژگی های اکسل مانند فرمول های آرایه استفاده می شود که تا حدودی روند ساخت رگرسیون را به هم می زند. ما همچنین توجه می کنیم که ساخت یک رگرسیون خطی، به نظر ما، با استفاده از توابع SLOPE و INTERCEPT ساده ترین است، که در آن اولی شیب رگرسیون خطی را تعیین می کند، و دومی، قطعه قطع شده توسط رگرسیون را تعیین می کند. در محور y

مزایای ابزار توابع داخلی برای تحلیل رگرسیون عبارتند از:

    یک فرآیند نسبتاً ساده از همان نوع تشکیل سری داده های مشخصه مورد مطالعه برای همه توابع آماری داخلی که خطوط روند را تعیین می کنند.

    یک تکنیک استاندارد برای ساخت خطوط روند بر اساس سری داده های تولید شده؛

    توانایی پیش بینی رفتار فرآیند مورد مطالعه برای تعداد مورد نیاز گام به جلو یا عقب.

و معایب شامل این واقعیت است که اکسل توابع داخلی برای ایجاد انواع دیگر خطوط روند (به جز خطی و نمایی) ندارد. این شرایط اغلب اجازه انتخاب یک مدل به اندازه کافی دقیق از فرآیند مورد مطالعه و همچنین به دست آوردن پیش بینی های نزدیک به واقعیت را نمی دهد. علاوه بر این، هنگام استفاده از توابع TREND و GROW، معادلات خطوط روند مشخص نیست.

لازم به ذکر است که نویسندگان هدف مقاله را ارائه سیر تحلیل رگرسیون با درجات مختلف کامل بودن قرار نداده اند. وظیفه اصلی آن نشان دادن قابلیت های بسته اکسل در حل مسائل تقریبی با استفاده از مثال های خاص است. نشان دهید که اکسل چه ابزارهای موثری برای ایجاد رگرسیون و پیش بینی دارد. نشان می‌دهد که چنین مشکلاتی حتی توسط کاربری که دانش عمیقی از تحلیل رگرسیون ندارد چقدر راحت می‌تواند حل شود.

نمونه هایی از حل مسائل خاص

حل مشکلات خاص را با استفاده از ابزارهای فهرست شده بسته اکسل در نظر بگیرید.

وظیفه 1

با جدولی از داده ها در مورد سود یک شرکت حمل و نقل موتوری برای سال 1995-2002. باید موارد زیر را انجام دهید

    یک نمودار بسازید.

    خطوط روند خطی و چند جمله ای (دو و مکعبی) را به نمودار اضافه کنید.

    با استفاده از معادلات خط روند، داده های جدولی در مورد سود شرکت برای هر خط روند برای 1995-2004 به دست آورید.

    برای سال های 2003 و 2004 سود شرکت را پیش بینی کنید.

راه حل مشکل

    در محدوده سلول های A4:C11 کاربرگ اکسل، کاربرگ نشان داده شده در شکل را وارد می کنیم. 4.

    با انتخاب محدوده سلول های B4:C11، نموداری می سازیم.

    نمودار ساخته شده را فعال می کنیم و با استفاده از روشی که در بالا توضیح داده شد، پس از انتخاب نوع خط روند در کادر محاوره ای خط روند (نگاه کنید به شکل 1)، به طور متناوب خطوط روند خطی، درجه دوم و مکعبی را به نمودار اضافه می کنیم. در همان کادر محاوره‌ای، تب پارامترها را باز کنید (شکل 2 را ببینید)، در نام فیلد منحنی تقریبی (صاف) نام روندی که باید اضافه شود را وارد کنید و در قسمت Forecast forward for: periods را تنظیم کنید. مقدار 2، زیرا قرار است پیش بینی سود برای دو سال آینده انجام شود. برای نمایش معادله رگرسیون و مقدار قابلیت اطمینان تقریبی R2 در ناحیه نمودار، کادرهای بررسی Show the equation on the screen را فعال کنید و مقدار قابلیت اطمینان تقریبی (R^2) را روی نمودار قرار دهید. برای درک بصری بهتر، نوع، رنگ و ضخامت خطوط روند رسم شده را تغییر می دهیم، که برای آن از تب View در کادر محاوره ای Trend Line Format استفاده می کنیم (شکل 3 را ببینید). نمودار حاصل با خطوط روند اضافه شده در شکل نشان داده شده است. 5.

    برای به دست آوردن داده های جدولی در مورد سود شرکت برای هر خط روند برای 1995-2004. بیایید از معادلات خطوط روند ارائه شده در شکل استفاده کنیم. 5. برای این کار در سلول های محدوده D3:F3 اطلاعات متنی نوع خط روند انتخابی را وارد کنید: روند خطی، روند درجه دوم، روند مکعبی. سپس فرمول رگرسیون خطی را در سلول D4 وارد کنید و با استفاده از نشانگر پر، این فرمول را با ارجاع نسبی به محدوده سلول های D5:D13 کپی کنید. لازم به ذکر است که هر سلول با فرمول رگرسیون خطی از محدوده سلول های D4:D13 دارای یک سلول مربوطه از محدوده A4:A13 به عنوان آرگومان است. به طور مشابه، برای رگرسیون درجه دوم، محدوده سلولی E4:E13 و برای رگرسیون مکعبی، محدوده سلولی F4:F13 پر می شود. بنابراین پیش‌بینی سود شرکت برای سال‌های 2003 و 2004 انجام شد. با سه گرایش جدول مقادیر به دست آمده در شکل نشان داده شده است. 6.

وظیفه 2

    یک نمودار بسازید.

    خطوط روند لگاریتمی، نمایی و نمایی را به نمودار اضافه کنید.

    معادلات خطوط روند به دست آمده و همچنین مقادیر قابلیت اطمینان تقریبی R2 را برای هر یک از آنها استخراج کنید.

    با استفاده از معادلات خط روند، داده های جدولی در مورد سود شرکت برای هر خط روند برای 1995-2002 به دست آورید.

    با استفاده از این خطوط روند، سود سال های 2003 و 2004 را برای کسب و کار پیش بینی کنید.

راه حل مشکل

با پیروی از روش ارائه شده در حل مسئله 1، نموداری را با خطوط روند لگاریتمی، نمایی و نمایی اضافه می کنیم (شکل 7). علاوه بر این، با استفاده از معادلات خط روند به‌دست‌آمده، جدول مقادیر سود شرکت را شامل مقادیر پیش‌بینی‌شده برای سال‌های 2003 و 2004 پر می‌کنیم. (شکل 8).

روی انجیر 5 و شکل مشاهده می شود که مدل با روند لگاریتمی با کمترین مقدار پایایی تقریبی مطابقت دارد.

R2 = 0.8659

بالاترین مقادیر R2 مربوط به مدل هایی با روند چند جمله ای است: درجه دوم (R2 = 0.9263) و مکعب (R2 = 0.933).

وظیفه 3

با جدول داده‌های سود یک شرکت حمل و نقل موتوری برای سال‌های 1995-2002، که در کار 1 ارائه شده است، باید مراحل زیر را انجام دهید.

    با استفاده از توابع TREND و GROW سری داده ها را برای خطوط روند خطی و نمایی دریافت کنید.

    با استفاده از توابع TREND و GROWTH، برای سال 2003 و 2004 سود شرکت را پیش بینی کنید.

    برای داده های اولیه و سری داده های دریافتی، یک نمودار بسازید.

راه حل مشکل

بیایید از کاربرگ وظیفه 1 استفاده کنیم (شکل 4 را ببینید). بیایید با تابع TREND شروع کنیم:

    محدوده سلول های D4:D11 را انتخاب کنید که باید با مقادیر تابع TREND مربوط به داده های شناخته شده در مورد سود شرکت پر شود.

    دستور Function را از منوی Insert فراخوانی کنید. در کادر محاوره‌ای Function Wizard که ظاهر می‌شود، تابع TREND را از دسته Statistical انتخاب کنید و سپس روی دکمه OK کلیک کنید. همین عملیات را می توان با فشار دادن دکمه (عملکرد Insert) نوار ابزار استاندارد انجام داد.

    در کادر محاوره‌ای Function Arguments که ظاهر می‌شود، محدوده سلول‌های C4:C11 را در قسمت Known_values_y وارد کنید. در قسمت Known_values_x - محدوده سلول های B4:B11;

    برای تبدیل فرمول وارد شده به فرمول آرایه از کلید ترکیبی + + استفاده کنید.

فرمولی که در نوار فرمول وارد کردیم به صورت زیر خواهد بود: =(TREND(C4:C11;B4:B11)).

در نتیجه، محدوده سلول های D4:D11 با مقادیر مربوط به تابع TREND پر می شود (شکل 9).

برای پیش بینی سود شرکت برای سال های 2003 و 2004. لازم:

    محدوده سلول های D12:D13 را انتخاب کنید، جایی که مقادیر پیش بینی شده توسط تابع TREND وارد می شود.

    تابع TREND را فراخوانی کنید و در کادر محاوره ای Function Arguments که ظاهر می شود، در قسمت Known_values_y - محدوده سلول های C4:C11 را وارد کنید. در قسمت Known_values_x - محدوده سلول های B4:B11; و در فیلد New_values_x - محدوده سلول های B12:B13.

    این فرمول را با استفاده از میانبر صفحه کلید Ctrl + Shift + Enter به فرمول آرایه تبدیل کنید.

    فرمول وارد شده به صورت زیر خواهد بود: =(TREND(C4:C11;B4:B11;B12:B13))، و محدوده سلول های D12:D13 با مقادیر پیش بینی شده تابع TREND پر می شود (شکل 1 را ببینید). 9).

به طور مشابه، یک سری داده با استفاده از تابع GROWTH پر می شود که در تجزیه و تحلیل وابستگی های غیرخطی استفاده می شود و دقیقاً مانند همتای خطی آن TREND عمل می کند.

شکل 10 جدول را در حالت نمایش فرمول نشان می دهد.

برای داده های اولیه و سری داده های به دست آمده، نمودار نشان داده شده در شکل. یازده

وظیفه 4

با جدول داده های دریافت درخواست خدمات توسط سرویس اعزام یک شرکت حمل و نقل موتوری برای دوره از 1 تا 11 روز ماه جاری، اقدامات زیر باید انجام شود.

    به دست آوردن سری داده ها برای رگرسیون خطی: با استفاده از توابع SLOPE و INTERCEPT. با استفاده از تابع LINEST

    یک سری داده برای رگرسیون نمایی با استفاده از تابع LYFFPRIB بازیابی کنید.

    با استفاده از توابع فوق، پیش بینی دریافت درخواست ها به سرویس اعزام را برای بازه زمانی دوازدهم تا چهاردهم ماه جاری انجام دهید.

    برای سری داده های اصلی و دریافتی، یک نمودار بسازید.

راه حل مشکل

توجه داشته باشید که برخلاف توابع TREND و GROW، هیچ یک از توابع ذکر شده در بالا (SLOPE، INTERCEPTION، LINEST، LGRFPRIB) رگرسیون نیستند. این توابع فقط نقش کمکی ایفا می کنند و پارامترهای رگرسیون لازم را تعیین می کنند.

برای رگرسیون های خطی و نمایی ساخته شده با استفاده از توابع SLOPE، INTERCEPT، LINEST، LGRFPRIB، شکل ظاهری معادلات آنها همیشه مشخص است، برخلاف رگرسیون های خطی و نمایی مربوط به توابع TREND و GROWTH.

1 . بیایید یک رگرسیون خطی بسازیم که دارای معادله باشد:

y=mx+b

با استفاده از توابع SLOPE و INTERCEPT، با شیب رگرسیون m توسط تابع SLOPE و عبارت ثابت b - توسط تابع INTERCEPT تعیین می شود.

برای انجام این کار، اقدامات زیر را انجام می دهیم:

    جدول منبع را در محدوده سلول های A4:B14 وارد کنید.

    مقدار پارامتر m در سلول C19 تعیین می شود. از دسته آماری تابع Slope را انتخاب کنید. محدوده سلول‌های B4:B14 را در قسمت Known_values_y و محدوده سلول‌های A4:A14 را در قسمت Known_values_x وارد کنید. فرمول در سلول C19 وارد می شود: =SLOPE(B4:B14;A4:A14);

    با استفاده از روش مشابه، مقدار پارامتر b در سلول D19 تعیین می شود. و محتوای آن به این صورت خواهد بود: = INTERCEPT(B4:B14;A4:A14). بنابراین، مقادیر پارامترهای m و b لازم برای ساخت یک رگرسیون خطی، به ترتیب در سلول‌های C19، D19 ذخیره می‌شوند.

    سپس فرمول رگرسیون خطی را در سلول C4 به شکل = $ C * A4 + $ D وارد می کنیم. در این فرمول، سلول های C19 و D19 با ارجاع مطلق نوشته می شوند (آدرس سلول نباید با کپی کردن احتمالی تغییر کند). علامت مرجع مطلق $ را می توان پس از قرار دادن مکان نما روی آدرس سلول یا از صفحه کلید یا با استفاده از کلید F4 تایپ کرد. با استفاده از دسته پر، این فرمول را در محدوده سلول های C4:C17 کپی کنید. سری داده های مورد نظر را بدست می آوریم (شکل 12). با توجه به اینکه تعداد درخواست ها یک عدد صحیح است، باید فرمت اعداد را در تب Number پنجره Cell Format با تعداد ارقام اعشار روی 0 قرار دهید.

2 . حالا بیایید یک رگرسیون خطی بسازیم که با معادله داده می شود:

y=mx+b

با استفاده از تابع LINEST

برای این:

    تابع LINEST را به عنوان یک فرمول آرایه در محدوده سلول های C20:D20: =(LINEST(B4:B14;A4:A14) وارد کنید. در نتیجه، مقدار پارامتر m را در سلول C20 و مقدار پارامتر b را در سلول D20 دریافت می کنیم.

    فرمول را در سلول D4 وارد کنید: =$C*A4+$D;

    این فرمول را با استفاده از نشانگر پر در محدوده سلول های D4:D17 کپی کنید و سری داده های مورد نظر را دریافت کنید.

3 . ما یک رگرسیون نمایی می سازیم که دارای معادله است:

با کمک تابع LGRFPRIBL، به طور مشابه انجام می شود:

    در محدوده سلول های C21:D21، تابع LGRFPRIBL را به عنوان فرمول آرایه وارد کنید: =( LGRFPRIBL (B4:B14;A4:A14)). در این حالت، مقدار پارامتر m در سلول C21 و مقدار پارامتر b در سلول D21 تعیین می شود.

    فرمول در سلول E4 وارد می شود: =$D*$C^A4;

    با استفاده از نشانگر پر، این فرمول در محدوده سلول های E4:E17، جایی که سری داده های رگرسیون نمایی قرار خواهد گرفت، کپی می شود (شکل 12 را ببینید).

روی انجیر 13 جدولی را نشان می دهد که در آن می توانیم توابعی را که با محدوده سلولی لازم استفاده می کنیم و همچنین فرمول ها را مشاهده کنیم.

ارزش آر 2 تماس گرفت ضریب تعیین.

وظیفه ساخت یک وابستگی رگرسیونی یافتن بردار ضرایب m مدل (1) است که در آن ضریب R حداکثر مقدار را می گیرد.

برای ارزیابی اهمیت R، از آزمون F فیشر استفاده می شود که با فرمول محاسبه می شود

جایی که n- حجم نمونه (تعداد آزمایش)؛

k تعداد ضرایب مدل است.

اگر F از مقدار بحرانی داده ها فراتر رود nو کو سطح اطمینان پذیرفته شده، پس مقدار R معنی دار در نظر گرفته می شود. جداول مقادیر بحرانی F در کتاب های مرجع آمار ریاضی آورده شده است.

بنابراین، اهمیت R نه تنها با مقدار آن، بلکه با نسبت بین تعداد آزمایش ها و تعداد ضرایب (پارامترهای) مدل نیز تعیین می شود. در واقع، نسبت همبستگی برای n=2 برای یک مدل خطی ساده 1 است (از طریق 2 نقطه در صفحه، همیشه می توانید یک خط مستقیم بکشید). با این حال، اگر داده های تجربی متغیرهای تصادفی باشند، باید به چنین مقدار R با دقت زیادی اعتماد کرد. معمولاً برای به دست آوردن یک رگرسیون قابل‌اعتماد و R، با هدف اطمینان از این است که تعداد آزمایش‌ها به طور قابل‌توجهی از تعداد ضرایب مدل (n>k) فراتر می‌رود.

برای ساخت یک مدل رگرسیون خطی، باید:

1) فهرستی از n ردیف و m ستون حاوی داده های تجربی (ستون حاوی مقدار خروجی) تهیه کنید. Yباید اولین یا آخرین در لیست باشد). به عنوان مثال، بیایید داده های کار قبلی را در نظر بگیریم، ستونی به نام "عدد دوره" را اضافه کنیم، تعداد دوره ها را از 1 تا 12 شماره گذاری کنیم. (این مقادیر خواهند بود. ایکس)

2) به منوی Data/Data Analysis/Regression بروید

اگر مورد «تجزیه و تحلیل داده» در منوی «ابزارها» وجود ندارد، باید به آیتم «افزونه‌های» همان منو بروید و کادر «بسته تحلیل» را علامت بزنید.

3) در کادر گفتگوی "Regression"، تنظیم کنید:

فاصله ورودی Y;

فاصله ورودی X;

فاصله خروجی - سلول سمت چپ بالای فاصله زمانی که نتایج محاسبه در آن قرار می گیرد (توصیه می شود آن را در یک کاربرگ جدید قرار دهید).

4) روی "OK" کلیک کنید و نتایج را تجزیه و تحلیل کنید.

اگر مقداری فیزیکی به کمیت دیگری بستگی داشته باشد، این وابستگی را می توان با اندازه گیری y در مقادیر مختلف x بررسی کرد. در نتیجه اندازه گیری ها، یک سری مقادیر به دست می آید:

x 1 , x 2 , ..., x i , ... , x n ;

y 1 , y 2 , ..., y i , ... , y n .

بر اساس داده های چنین آزمایشی، می توان وابستگی y = ƒ(x) را ترسیم کرد. منحنی حاصل قضاوت در مورد شکل تابع ƒ(x) را ممکن می سازد. با این حال، ضرایب ثابتی که وارد این تابع می شوند ناشناخته باقی می مانند. آنها را می توان با استفاده از روش حداقل مربعات تعیین کرد. نقاط آزمایشی، به عنوان یک قاعده، دقیقاً روی منحنی قرار نمی گیرند. روش حداقل مربعات مستلزم آن است که مجموع انحرافات مجذور نقاط تجربی از منحنی، یعنی. 2 کوچکترین بود.

در عمل، این روش اغلب (و به سادگی) در مورد یک رابطه خطی استفاده می شود، یعنی. چه زمانی

y=kxیا y = a + bx.

وابستگی خطی در فیزیک بسیار گسترده است. و حتی زمانی که وابستگی غیر خطی است، معمولا سعی می کنند یک نمودار را به گونه ای بسازند که یک خط مستقیم به دست آید. به عنوان مثال، اگر فرض شود که ضریب شکست شیشه n با طول موج λ موج نور با رابطه n = a + b/λ 2 مرتبط است، آنگاه وابستگی n به λ -2 بر روی نمودار رسم می شود. .

وابستگی را در نظر بگیرید y=kx(خط مستقیم که از مبدا می گذرد). اجازه دهید مقدار φ را جمع مجذور انحراف نقاط خود از خط مستقیم بسازیم

مقدار φ همیشه مثبت است و معلوم می شود که کوچکتر است، نقاط ما به خط مستقیم نزدیکتر هستند. روش حداقل مربعات بیان می کند که برای k باید چنین مقداری انتخاب شود که φ دارای حداقل باشد


یا
(19)

محاسبه نشان می دهد که خطای ریشه میانگین مربع در تعیین مقدار k برابر است با

, (20)
که در آن n تعداد ابعاد است.

اجازه دهید اکنون یک مورد کمی دشوارتر را در نظر بگیریم، زمانی که نقاط باید فرمول را برآورده کنند y = a + bx(خط مستقیمی که از مبدأ نمی گذرد).

وظیفه یافتن بهترین مقادیر a و b از مجموعه مقادیر داده شده x i, y i است.

دوباره یک فرم درجه دوم φ برابر با مجذور انحرافات نقاط x i , y i از خط مستقیم می سازیم.

و مقادیر a و b را پیدا کنید که φ برای آنها حداقل است

;

.

.

حل مشترک این معادلات به دست می دهد

(21)

خطاهای ریشه میانگین مربع در تعیین a و b برابر است

(23)

.  (24)

هنگام پردازش نتایج اندازه گیری با این روش، خلاصه کردن تمام داده ها در جدولی که در آن تمام مقادیر موجود در فرمول (19) (24) از ابتدا محاسبه شده است، راحت است. اشکال این جداول در مثال های زیر نشان داده شده است.

مثال 1معادله اصلی دینامیک حرکت چرخشی ε = M/J (خط مستقیمی که از مبدا می گذرد) مورد مطالعه قرار گرفت. برای مقادیر مختلف لحظه M، شتاب زاویه ای ε یک جسم خاص اندازه گیری شد. تعیین ممان اینرسی این جسم مورد نیاز است. نتایج اندازه گیری گشتاور نیرو و شتاب زاویه ای در ستون های دوم و سوم ذکر شده است. جداول 5.

جدول 5
n M، N m ε, s-1 M2 M ε ε - کیلومتر (ε - کیلومتر) 2
1 1.44 0.52 2.0736 0.7488 0.039432 0.001555
2 3.12 1.06 9.7344 3.3072 0.018768 0.000352
3 4.59 1.45 21.0681 6.6555 -0.08181 0.006693
4 5.90 1.92 34.81 11.328 -0.049 0.002401
5 7.45 2.56 55.5025 19.072 0.073725 0.005435
– – 123.1886 41.1115 – 0.016436

با فرمول (19) تعیین می کنیم:

.

برای تعیین خطای ریشه میانگین مربع از فرمول (20) استفاده می کنیم.

0.005775کیلوگرم-1 · متر -2 .

با فرمول (18) داریم

; .

SJ = (2.996 0.005775)/0.3337 = 0.05185 کیلوگرم متر مربع.

با توجه به پایایی 0.95 = P، با توجه به جدول ضرایب Student برای n = 5، t = 2.78 را پیدا می کنیم و خطای مطلق ΔJ = 2.78 0.05185 = 0.1441 ≈ 0.2 را تعیین می کنیم. کیلوگرم متر مربع.

نتایج را به شکل زیر می نویسیم:

J = (0.2 ± 3.0) کیلوگرم متر مربع;


مثال 2ضریب دمایی مقاومت فلز را با استفاده از روش حداقل مربعات محاسبه می کنیم. مقاومت طبق یک قانون خطی به دما بستگی دارد

R t \u003d R 0 (1 + α t °) \u003d R 0 + R 0 α t °.

عبارت آزاد مقاومت R 0 را در دمای 0 درجه سانتیگراد تعیین می کند و ضریب زاویه ای حاصل ضرب ضریب دما α و مقاومت R 0 است.

نتایج اندازه گیری ها و محاسبات در جدول ( جدول 6 را ببینید).

جدول 6
n t°, s r، اهم t-¯t (t-¯t) 2 (t-¯t)r r-bt-a (r - bt - a) 2،10 -6
1 23 1.242 -62.8333 3948.028 -78.039 0.007673 58.8722
2 59 1.326 -26.8333 720.0278 -35.581 -0.00353 12.4959
3 84 1.386 -1.83333 3.361111 -2.541 -0.00965 93.1506
4 96 1.417 10.16667 103.3611 14.40617 -0.01039 107.898
5 120 1.512 34.16667 1167.361 51.66 0.021141 446.932
6 133 1.520 47.16667 2224.694 71.69333 -0.00524 27.4556
515 8.403 – 8166.833 21.5985 – 746.804
∑/n 85.83333 1.4005 – – – – –

با فرمول های (21)، (22) تعیین می کنیم

R 0 = ¯ R- α R 0 ¯ t = 1.4005 - 0.002645 85.83333 = 1.1735 اهم.

اجازه دهید یک خطا در تعریف α پیدا کنیم. از آنجا که، پس با فرمول (18) داریم:

.

با استفاده از فرمول های (23)، (24) داریم

;

0.014126 اهم.

با توجه به پایایی 0.95 = P، با توجه به جدول ضرایب Student برای n = 6، t = 2.57 را پیدا کرده و خطای مطلق Δα = 2.57 0.000132 = 0.000338 را تعیین می کنیم. درجه -1.

α = (23 ± 4) 10 -4 تگرگ-1 در P = 0.95.


مثال 3برای تعیین شعاع انحنای عدسی از حلقه های نیوتن لازم است. شعاع حلقه های نیوتن r m اندازه گیری شد و تعداد این حلقه ها m تعیین شد. شعاع حلقه های نیوتن به شعاع انحنای عدسی R و عدد حلقه با معادله مربوط می شود.

r 2 m = mλR - 2d 0 R,

جایی که d 0 ضخامت شکاف بین عدسی و صفحه موازی صفحه (یا تغییر شکل عدسی)،

λ طول موج نور فرودی است.

λ = (6 ± 600) نانومتر.
r 2 m = y;
m = x;
λR = b;
-2d 0 R = a،

سپس معادله شکل خواهد گرفت y = a + bx.

.

نتایج اندازه گیری ها و محاسبات وارد می شود جدول 7.

جدول 7
n x = m y \u003d r 2، 10 -2 mm 2 m-¯m (m-¯m) 2 (m-¯m)y y-bx-a، 10-4 (y - bx - a) 2، 10 -6
1 1 6.101 -2.5 6.25 -0.152525 12.01 1.44229
2 2 11.834 -1.5 2.25 -0.17751 -9.6 0.930766
3 3 17.808 -0.5 0.25 -0.08904 -7.2 0.519086
4 4 23.814 0.5 0.25 0.11907 -1.6 0.0243955
5 5 29.812 1.5 2.25 0.44718 3.28 0.107646
6 6 35.760 2.5 6.25 0.894 3.12 0.0975819
21 125.129 – 17.5 1.041175 – 3.12176
∑/n 3.5 20.8548333 – – – – –

انتخاب نوع تابع رگرسیون، یعنی. نوع مدل در نظر گرفته شده وابستگی Y به X (یا X به Y)، به عنوان مثال، یک مدل خطی y x = a + bx، لازم است مقادیر خاص ضرایب مدل را تعیین کنید.

برای مقادیر مختلف a و b می توان تعداد بی نهایت وابستگی به شکل y x =a+bx ساخت، یعنی تعداد بی نهایت خط در صفحه مختصات وجود دارد، اما ما به چنین وابستگی نیاز داریم که به بهترین شکل با مقادیر مشاهده شده مطابقت دارد. بنابراین، مشکل به انتخاب بهترین ضرایب کاهش می یابد.

ما به دنبال یک تابع خطی a + bx هستیم که فقط بر اساس تعداد معینی از مشاهدات موجود است. برای یافتن تابعی با بهترین تناسب با مقادیر مشاهده شده، از روش حداقل مربعات استفاده می کنیم.

نشان دهید: Y i - مقدار محاسبه شده با معادله Y i =a+bx i . y i - مقدار اندازه گیری شده، ε i =y i -Y i - تفاوت بین مقادیر اندازه گیری شده و محاسبه شده، ε i =y i -a-bx i.

روش حداقل مربعات مستلزم این است که εi، تفاوت بین y i اندازه گیری شده و مقادیر Y i محاسبه شده از معادله، حداقل باشد. بنابراین، ضرایب a و b را پیدا می کنیم تا مجذور انحرافات مقادیر مشاهده شده از مقادیر روی خط رگرسیون مستقیم کوچکترین باشد:

با بررسی این تابع از آرگومان‌های a و با کمک مشتقات یک منتهی، می‌توان ثابت کرد که اگر ضرایب a و b جواب‌های سیستم باشند، تابع حداقل مقدار را به خود می‌گیرد:

(2)

اگر هر دو طرف معادلات عادی را بر n تقسیم کنیم، به دست می آید:

با توجه به اینکه (3)

گرفتن ، از اینجا، با جایگزینی مقدار a در معادله اول، به دست می آوریم:

در این حالت b ضریب رگرسیون نامیده می شود. a عضو آزاد معادله رگرسیون نامیده می شود و با فرمول محاسبه می شود:

خط مستقیم حاصل تخمینی برای خط رگرسیون نظری است. ما داریم:

بنابراین، معادله رگرسیون خطی است.

رگرسیون می تواند مستقیم (b>0) و معکوس (b مثال 1) باشد. نتایج اندازه گیری مقادیر X و Y در جدول آورده شده است:

x i -2 0 1 2 4
y من 0.5 1 1.5 2 3

با فرض وجود رابطه خطی بین X و Y y=a+bx، ضرایب a و b را با استفاده از روش حداقل مربعات تعیین کنید.

راه حل. در اینجا n=5
x i =-2+0+1+2+4=5;
x i 2 =4+0+1+4+16=25
x i y i =-2 0.5+0 1+1 1.5+2 2+4 3=16.5
y i =0.5+1+1.5+2+3=8

و سیستم نرمال (2) دارای فرم است

با حل این سیستم به دست می آید: b=0.425، a=1.175. بنابراین y=1.175+0.425x.

مثال 2. یک نمونه 10 مشاهده ای از شاخص های اقتصادی (X) و (Y) وجود دارد.

x i 180 172 173 169 175 170 179 170 167 174
y من 186 180 176 171 182 166 182 172 169 177

لازم است یک معادله رگرسیون نمونه Y بر روی X پیدا کنید. یک خط رگرسیون نمونه Y بر روی X بسازید.

راه حل. 1. بیایید داده ها را بر اساس مقادیر x i و y i مرتب کنیم. ما یک جدول جدید دریافت می کنیم:

x i 167 169 170 170 172 173 174 175 179 180
y من 169 171 166 172 180 176 177 182 182 186

برای ساده تر شدن محاسبات، یک جدول محاسباتی تهیه می کنیم که در آن مقادیر عددی لازم را وارد می کنیم.

x i y من x i 2 x i y i
167 169 27889 28223
169 171 28561 28899
170 166 28900 28220
170 172 28900 29240
172 180 29584 30960
173 176 29929 30448
174 177 30276 30798
175 182 30625 31850
179 182 32041 32578
180 186 32400 33480
∑x i =1729 ∑y i =1761 ∑x i 2 299105 ∑x i y i =304696
x=172.9 y=176.1 x i 2 = 29910.5 xy=30469.6

طبق فرمول (4) ضریب رگرسیون را محاسبه می کنیم

و با فرمول (5)

بنابراین، معادله رگرسیون نمونه مانند y=-59.34+1.3804x است.
بیایید نقاط (x i ; y i) را در صفحه مختصات رسم کنیم و خط رگرسیون را مشخص کنیم.


شکل 4

شکل 4 نشان می دهد که چگونه مقادیر مشاهده شده نسبت به خط رگرسیون قرار می گیرند. برای تخمین عددی انحراف y i از Y i، که در آن y i مقادیر مشاهده شده و Y i مقادیری هستند که با رگرسیون تعیین می شوند، جدولی را می سازیم:

x i y من Y من Y i -y i
167 169 168.055 -0.945
169 171 170.778 -0.222
170 166 172.140 6.140
170 172 172.140 0.140
172 180 174.863 -5.137
173 176 176.225 0.225
174 177 177.587 0.587
175 182 178.949 -3.051
179 182 184.395 2.395
180 186 185.757 -0.243

مقادیر Y i با توجه به معادله رگرسیون محاسبه می شود.

انحراف قابل توجه برخی از مقادیر مشاهده شده از خط رگرسیون با تعداد کم مشاهدات توضیح داده می شود. هنگام مطالعه درجه وابستگی خطی Y به X، تعداد مشاهدات در نظر گرفته می شود. قدرت وابستگی با مقدار ضریب همبستگی تعیین می شود.

مشکل پیدا کردن ضرایب وابستگی خطی است که برای آنها تابع دو متغیر است آو بکمترین مقدار را می گیرد. یعنی با توجه به داده ها آو بمجموع انحرافات مجذور داده های تجربی از خط مستقیم یافت شده کوچکترین خواهد بود. این نکته کل روش حداقل مربعات است.

بنابراین، حل مثال به یافتن حد فاصل یک تابع از دو متغیر خلاصه می شود.

استخراج فرمول برای یافتن ضرایب.یک سیستم دو معادله با دو مجهول گردآوری و حل می شود. یافتن مشتقات جزئی توابع توسط متغیرها آو ب، این مشتقات را با صفر برابر می کنیم.

سیستم معادلات حاصل را با هر روشی حل می کنیم (مثلاً روش جایگزینی یا روش کرامر) و فرمول هایی برای یافتن ضرایب با استفاده از روش حداقل مربعات (LSM) به دست می آوریم.

با داده آو بتابع کمترین مقدار را می گیرد.

این کل روش حداقل مربعات است. فرمول برای یافتن پارامتر آشامل مجموع ، ، ، و پارامتر است n- مقدار داده های تجربی مقادیر این مبالغ توصیه می شود به طور جداگانه محاسبه شوند. ضریب ببعد از محاسبه پیدا شد آ.

حوزه اصلی کاربرد چنین چند جمله ای ها پردازش داده های تجربی (ساخت فرمول های تجربی) است. واقعیت این است که چند جمله ای درون یابی ساخته شده از مقادیر تابع به دست آمده با کمک آزمایش به شدت تحت تأثیر "نویز تجربی" قرار می گیرد، علاوه بر این، در حین درون یابی، گره های درون یابی نمی توانند تکرار شوند، یعنی. شما نمی توانید از نتایج آزمایش های مکرر در شرایط یکسان استفاده کنید. چند جمله ای ریشه میانگین مربع نویز را صاف می کند و استفاده از نتایج آزمایش های متعدد را ممکن می کند.

ادغام و تمایز عددی مثال.

ادغام عددی- محاسبه مقدار یک انتگرال معین (به عنوان یک قاعده، تقریبی). یکپارچه سازی عددی به عنوان مجموعه ای از روش های عددی برای یافتن مقدار یک انتگرال معین درک می شود.

تمایز عددی- مجموعه ای از روش ها برای محاسبه مقدار مشتق یک تابع به طور مجزا.

ادغام

فرمول بندی مسئله.بیان ریاضی مسئله: یافتن مقدار یک انتگرال خاص ضروری است

جایی که a، b متناهی هستند، f(x) در [а، b] پیوسته است.

هنگام حل مسائل عملی، اغلب اتفاق می افتد که انتگرال به صورت تحلیلی ناخوشایند یا غیرممکن است: ممکن است در توابع ابتدایی بیان نشود، انتگرال را می توان به شکل جدول ارائه داد و غیره. در چنین مواردی، روش های انتگرال عددی عبارتند از: استفاده شده. روش‌های ادغام عددی از جایگزینی مساحت ذوزنقه منحنی با مجموع محدودی از مناطق اشکال هندسی ساده‌تر استفاده می‌کنند که می‌توان دقیقاً محاسبه کرد. در این معنا از استفاده از فرمول های تربیعی صحبت می شود.

اکثر روش ها از نمایش انتگرال به عنوان یک مجموع محدود (فرمول مربعات) استفاده می کنند:

فرمول های ربع بر اساس ایده جایگزینی نمودار انتگرال در بازه ادغام با توابعی از فرم ساده تر است که می تواند به راحتی به صورت تحلیلی ادغام شود و بنابراین به راحتی محاسبه شود. ساده ترین کار ساخت فرمول های ربع برای مدل های ریاضی چند جمله ای تحقق می یابد.

سه گروه از روش ها را می توان تشخیص داد:

1. روش با تقسیم بخش ادغام به فواصل مساوی. تقسیم به فواصل از قبل انجام می شود، معمولاً فواصل مساوی انتخاب می شوند (برای سهولت محاسبه تابع در انتهای فواصل). مساحت ها را محاسبه کرده و آنها را جمع آوری کنید (روش های مستطیل، ذوزنقه، سیمپسون).

2. روش های پارتیشن بندی بخش ادغام با استفاده از نقاط خاص (روش گاوس).

3. محاسبه انتگرال ها با استفاده از اعداد تصادفی (روش مونت کارلو).

روش مستطیل.اجازه دهید تابع (طراحی) به صورت عددی روی قطعه یکپارچه شود. قطعه را به N بازه مساوی تقسیم می کنیم. مساحت هر یک از ذوزنقه های منحنی N را می توان با مساحت یک مستطیل جایگزین کرد.

عرض همه مستطیل ها یکسان و برابر است با:

به عنوان انتخابی از ارتفاع مستطیل ها، می توانید مقدار تابع را در حاشیه سمت چپ انتخاب کنید. در این حالت، ارتفاع مستطیل اول f(a)، مستطیل دوم f(x 1)،…، N-f(N-1) خواهد بود.

اگر مقدار تابع روی حاشیه سمت راست را به عنوان انتخاب ارتفاع مستطیل در نظر بگیریم، در این حالت ارتفاع مستطیل اول f (x 1)، دومی - f (x 2)، خواهد بود. ..، N - f (x N).

همانطور که مشاهده می شود، در این مورد یکی از فرمول ها تقریبی به انتگرال با اضافه و دومی با کمبود می دهد. راه دیگری وجود دارد - استفاده از مقدار تابع در وسط بخش ادغام برای تقریب:

تخمین خطای مطلق روش مستطیل ها (وسط)

تخمین خطای مطلق روش های مستطیل چپ و راست.

مثال.کل فاصله را محاسبه کنید و فاصله را به چهار بخش تقسیم کنید

راه حل.محاسبه تحلیلی این انتگرال I=arctg(1)–arctg(0)=0.7853981634 را به دست می دهد. در مورد ما:

1) h = 1; xo = 0; x1 = 1;

2) h = 0.25 (1/4); x0 = 0; x1 = 0.25; x2 = 0.5; x3 = 0.75; x4 = 1;

ما با روش مستطیل های چپ محاسبه می کنیم:

ما با روش مستطیل های قائم الزاویه محاسبه می کنیم:

با روش مستطیل های متوسط ​​محاسبه کنید:

روش ذوزنقه ای.استفاده از یک چند جمله ای درجه اول برای درون یابی (یک خط مستقیم که از دو نقطه کشیده شده است) به فرمول ذوزنقه ای منجر می شود. انتهای بخش ادغام به عنوان گره های درون یابی در نظر گرفته می شود. بنابراین، ذوزنقه منحنی با یک ذوزنقه معمولی جایگزین می شود، که مساحت آن را می توان حاصل ضرب نصف مجموع پایه ها و ارتفاع یافت.

در مورد N بخش ادغام برای همه گره ها، به جز نقاط انتهایی قطعه، مقدار تابع دو بار در مجموع کل گنجانده می شود (از آنجایی که ذوزنقه های همسایه یک ضلع مشترک دارند)

فرمول ذوزنقه ای را می توان با گرفتن نصف مجموع فرمول های مستطیل در امتداد لبه های راست و چپ قطعه به دست آورد:

بررسی پایداری محلولبه عنوان یک قاعده، طول هر بازه کوتاهتر است، یعنی. هرچه تعداد این بازه ها بیشتر باشد، تفاوت بین مقادیر تقریبی و دقیق انتگرال کمتر می شود. این برای اکثر توابع صادق است. در روش ذوزنقه ای، خطا در محاسبه انتگرال ϭ تقریباً متناسب با مربع مرحله انتگرال است (ϭ ~ h 2) بنابراین برای محاسبه انتگرال یک تابع معین در حدود a، b، لازم است قطعه را به فواصل N 0 تقسیم کنید و مجموع مساحت ذوزنقه را پیدا کنید. سپس باید تعداد فواصل N 1 را افزایش دهید، دوباره مجموع ذوزنقه را محاسبه کنید و مقدار حاصل را با نتیجه قبلی مقایسه کنید. این کار باید تا (N i) تکرار شود تا به دقت مشخص شده نتیجه (معیار همگرایی) برسد.

برای روش‌های مستطیل و ذوزنقه معمولاً در هر مرحله تکرار، تعداد بازه‌ها با ضریب 2 افزایش می‌یابد (Ni +1 =2N i).

معیار همگرایی:

مزیت اصلی قانون ذوزنقه سادگی آن است. با این حال، اگر ادغام نیاز به دقت بالایی داشته باشد، این روش ممکن است به تکرارهای زیادی نیاز داشته باشد.

خطای مطلق روش ذوزنقه ایرتبه بندی شده است
.

مثال.با استفاده از فرمول ذوزنقه یک انتگرال تقریبا معین را محاسبه کنید.

الف) تقسیم بخش ادغام به 3 قسمت.
ب) تقسیم بخش ادغام به 5 قسمت.

راه حل:
الف) طبق شرط، بخش ادغام باید به 3 قسمت تقسیم شود، یعنی.
طول هر بخش از پارتیشن را محاسبه کنید: .

بنابراین، فرمول کلی ذوزنقه ها به اندازه دلپذیر کاهش می یابد:

سرانجام:

به شما یادآوری می کنم که مقدار حاصل مقدار تقریبی مساحت است.

ب) قطعه یکپارچه را به 5 قسمت مساوی تقسیم می کنیم، یعنی . با افزایش تعداد بخش ها، دقت محاسبات را افزایش می دهیم.

اگر، پس فرمول ذوزنقه ای شکل زیر را به خود می گیرد:

بیایید مرحله پارتیشن بندی را پیدا کنیم:
، یعنی طول هر قطعه میانی 0.6 است.

هنگام اتمام کار، راحت است که تمام محاسبات را با یک جدول محاسبه ترسیم کنید:

در خط اول می نویسیم "counter"

در نتیجه:

خوب، واقعاً یک توضیح وجود دارد، و یک توضیح جدی!
اگر برای 3 بخش از پارتیشن، سپس برای 5 بخش. اگر بخش بیشتری را انتخاب کنید => دقیق تر خواهد بود.

فرمول سیمپسونفرمول ذوزنقه ای نتیجه ای به دست می دهد که به شدت به اندازه گام h بستگی دارد، که بر دقت محاسبه یک انتگرال معین تأثیر می گذارد، به ویژه در مواردی که تابع غیر یکنواخت است. می توان افزایش دقت محاسبات را فرض کرد اگر به جای پاره های خطوط مستقیم که جایگزین قطعات منحنی نمودار تابع f(x) شوند، برای مثال از قطعات سهمی که از طریق سه نقطه همسایه نمودار داده شده اند استفاده کنیم. . تفسیر هندسی مشابهی زیربنای روش سیمپسون برای محاسبه انتگرال معین است. کل فاصله ادغام a,b به N بخش تقسیم می شود، طول قطعه نیز برابر با h=(b-a)/N خواهد بود.

فرمول سیمپسون این است:

مدت باقی مانده

با افزایش طول قطعات، دقت فرمول کاهش می یابد، بنابراین برای افزایش دقت از فرمول ترکیبی سیمپسون استفاده می شود. کل فاصله ادغام به تعداد زوج از بخش های یکسان N تقسیم می شود، طول قطعه نیز برابر با h=(b-a)/N خواهد بود. فرمول ترکیبی سیمپسون به صورت زیر است:

در فرمول، عبارات داخل پرانتز مجموع مقادیر انتگرال، به ترتیب، در انتهای بخش های فرد و زوج داخلی هستند.

عبارت باقی مانده از فرمول سیمپسون در حال حاضر با توان چهارم مرحله متناسب است:

مثال:انتگرال را با استفاده از قانون سیمپسون محاسبه کنید. (راه حل دقیق - 0.2)

روش گاوس

فرمول ربع گاوس. اصل اساسی فرمول های مربعی نوع دوم از شکل 1.12 قابل مشاهده است: لازم است نقاط را به گونه ای قرار دهیم. ایکس 0 و ایکس 1 در داخل بخش [ آ;ب] به طوری که مساحت «مثلث» در مجموع با مساحت «قطعه» برابر باشد. هنگام استفاده از فرمول گاوس، بخش اولیه [ آ;ب] با تغییر متغیر به بازه [-1;1] کاهش می یابد ایکسبر

0.5∙(بآ)∙تی+ 0.5∙(ب + آ).

سپس ، جایی که .

این جایگزینی در صورتی امکان پذیر است آو بمحدود هستند و تابع f(ایکس) پیوسته در [ آ;ب]. فرمول گاوس برای nنکته ها x i, من=0,1,..,n-1 در داخل قطعه [ آ;ب]:

, (1.27)

جایی که تی منو Aiبرای مختلف nدر کتاب های مرجع آورده شده است. مثلاً وقتی n=2 آ 0 =آ 1=1; در n=3: تی 0 =t 2" 0.775، تی 1 =0, آ 0 =A 2" 0.555، آ 1 اینچ 0.889.

فرمول ربع گاوس

با تابع وزنی برابر با یک به دست می آید p(x)= 1 و گره ها x i، که ریشه های چند جمله ای لژاندر هستند

شانس Aiبه راحتی با فرمول محاسبه می شود

من=0,1,2,...n.

مقادیر گره ها و ضرایب برای n=2،3،4،5 در جدول آورده شده است.

سفارش گره ها شانس
n=2 x 1=0 x 0 =-x2=0.7745966692 الف 1=8/9 A 0 = A 2=5/9
n=3 x 2 =-x 1=0.3399810436 x 3 =-x0=0.8611363116 A 1 = A 2=0.6521451549 A 0 = A 3=0.6521451549
n=4 ایکس 2 = 0 ایکس 3 = -ایکس 1 = 0.5384693101 ایکس 4 =-ایکس 0 =0.9061798459 آ 0 =0.568888899 آ 3 =آ 1 =0.4786286705 آ 0 =آ 4 =0.2869268851
n=5 ایکس 5 = -ایکس 0 =0.9324695142 ایکس 4 = -ایکس 1 =0.6612093865 ایکس 3 = -ایکس 2 =0.2386191861 آ 5 =A 0 =0.1713244924 آ 4 =A 1 =0.3607615730 آ 3 =A 2 =0.4679139346

مثال.مقدار را با استفاده از فرمول گاوس برای محاسبه کنید n=2:

ارزش دقیق: .

الگوریتم محاسبه انتگرال با توجه به فرمول گاوس، دو برابر کردن تعداد ریزبخش ها را فراهم نمی کند، بلکه برای افزایش تعداد ارتین ها با 1 و مقایسه مقادیر به دست آمده از انتگرال فراهم می کند. مزیت فرمول گاوس دقت بالا با تعداد نسبتاً کمی از ارتین است. معایب: ناخوشایند برای محاسبات دستی. باید در حافظه کامپیوتر ذخیره شود تی من, Aiبرای مختلف n.

خطای فرمول ربع گاوس در قطعه در همان زمان خواهد بود، برای فرمول جمله باقیمانده جایی خواهد بود که ضریب α نبا رشد به سرعت کاهش می یابد ن. اینجا

فرمول های گاوس در حال حاضر با تعداد کمی از گره ها (از 4 تا 10) دقت بالایی ارائه می دهند.در این مورد، در محاسبات عملی، تعداد گره ها از چند صد تا چند هزار متغیر است. همچنین متذکر می شویم که اوزان ربع گاوسی همیشه مثبت هستند، که ثبات الگوریتم را برای محاسبه مجموع تضمین می کند.

بالا