» :: آمار 6. نمونه برداری تصادفی و جمعیت مورد مطالعه در زمینه ارتباط بین وزن نوزاد بعد از تولد و میزان مرگ و میر کودکان
نمونه برداری تصادفی و جمعیت مورد مطالعه در زمینه ارتباط بین وزن نوزاد بعد از تولد و میزان مرگ و میر کودکان
تمام مواردی که در فصل قبلی بیان شد در مورد خصوصیات جمعیتی اعمال می گردد. اما ما تقریبا همیشه با نمونه ها با توجه به اطلاعات محدود و مختلف سروکار داریم. با در نظر گرفتن نمونه های تصادفی تولد، چگونه می توانیم به بررسی رابطه بین وزن نوزاد متولد شده و مرگ و میر کودکان پردازیم؟ چه نوع صحتی را می توانیم پیش بینی کنیم و چگونه این موارد بستگی به اندازه نمونه دارد؟ آیا مهم می باشد که چگونه انتخابی را در مورد نمونه برداری میزان تولدها انجام دهیم؟ ما می بایست با موضوعات زیر روبرو شویم.
» :: آمار 5. مقدمه ای در ارتباط با انتخاب متغیر و مشخصه ها
مقدمه ای در ارتباط با انتخاب متغیر و مشخصه ها
چکیده
متغیر و انتخاب مشخصه به عنوان نقطه تمرکز اکثر پژوهش ها در زمینه های کاربردی بود که در ارتباط با آن ها پایگاه های داده یا صدها هزار متغیر موجود می باشند. این حوزه های شامل پردازش اسناد اینترنتی، تجزیه و تحلیل آرایش ژن و شیمی ترکیبی می باشد. اهداف مرتبط به انتخاب متغیر سه گانه می باشد: بهبود عملکرد پیش بینی شاخص ها، ایجاد شاخص های به صرفه تر و سریعتر، ایجاد درک بهتری از فرایند اصولی که داده ها را ایجاد می کند. سهم این موضوعات خاص محدوده گسترده ای از جنبه های مرتبط با چنین موضوعاتی را تحت پوشش قرار می دهد: تعریف بهتری از تابع هدف، ایجاد مشخصه، رده بندی مشخصه، انتخاب مشخصه های چندمتغیری، روش جستجوی مناسب، و روش ارزیابی اعتبار مشخصه ارائه می دهد.
کلیدواژه: انتخاب متغیر، انتخاب مشخصه، کاهش ابعاد فضا، کشف الگو، فیلترها، بسته بندی، خوشه بندی، نظریه اطلاعات، دستگاه های بردار پشتیبانی، انتخاب مدل، تست آماری، بیوانفورماتیک، بیولوژی محاسبه، القای ژنی، میکرو آرایه، علم ژنتیک، پروتومیک، QSAR، دسته بندی متنی، بازیابی اطلاعات.
» :: آمار 4. تست توزیع نرمال در برابر توزیع منطقی با استفاده از روش تقریب سادلپوینت
تست توزیع نرمال در برابر توزیع منطقی با استفاده از روش تقریب سادلپوینت
چکیده
ما مشکلات مربوط به تست توزیع نرمال را در برابر توزیع منطقی بر مبنای نمونه تصادفی بررسی ها مد نظر قرار می دهیم. چون این دو روش به صورت مجزا ( تست نشده) می باشند، نسبت آمار احتمالات حداکثر (RML) دارای توزیع مربع خی با انطباق معمول نمی باشد. ما روش تخمین سادلپوینت را نسبت به توزیع آماری RML مد نظر قرار داده و نشان می دهیم که این روش تقریب بسیار دقیق تر از روش تقریبی استاندارد و ادج ورث، به ویژه در مورد احتمالاتی که دارای ارزش قابل توجهی در تست فرضیه ها می باشند، است. همچنین نشان داده شده است که این تست تقریبا مشابه تست نامتغیرهای قوی می باشد.
کلید واژه. بسط ادج ورث، آزمون نسبت احتمال، آزمون نامتغیرهای قوی، نسبت احتمال حداکثر (RML)، تقریب احتمال دامنه
نمونه ها از یک صنعت تولیدی در مالزی برداشته شد. به چند دلیل، تغییر تهیه حساب برای مدیران ( حسابداری مدیریتی) احتمالا در این نوع از شرکت روی می دهد. شرکت های تولیدی در معرض تغییراتی در ارتباط با محیط تولید همانند تغییرات در ساختار هزینه تولید و تکنیک های تولید با فناوری جدید قرار می گیرند. این صنعت به این دلیل انتخاب شده است که به عنوان فعال ترین و مهمترین حامی اقتصاد مالزی می باشد. .....
ما در اینجا به معرفی تعدادی از نمونه های عددی برای توضیح اینکه چگونه اقتصاد در مسیر انتقال حرکت می کند می پردازیم. ما تلاشی را به منظور انتخاب مقادیر پارامتر مورد قبول و ایجاد شبیه سازی هایی که به طور واقع گرایانه همانند آن باشد انجام می دهیم. به هر حال این مدل حاصل تعدادی از فرایندهای مهمی می باشد که به شکل دهی رشد اقتصادی و مشکلات مربوط به آن می پردازد. به این ترتیب چنین نمونه هایی نمی بایست به طور حقیقی در نظر گرفته شوند. مهمتر اینکه، آن ها حدی را نشان می دهند، که میزان رشد با مد نظر قرار دادن خطرات مربوط به فناوری خاص، کمتر می گردد......
در این فصل ما به معرفی موضوعات مرتبط به آمار توصیفی پرداخته و در انجام این کار روش هایی را برای توصیف و خلاصه کردن مجموعه داده ها یاد گرفته ایم. بخش 2.2 در ارتباط با روش های توصیف مجموعه داده ها می باشد. زیرشاخه های 2.2.1 و 2.2.2 نشان می دهد که چگونه داده ها که بر مبنای مقادیر مجزا می باشند، با استفاده از جدول فراوانی و نمودار توصیف می گردند، درحالی که زیربخش های 2.2.3 مرتبط به داده هایی می باشند که مجموعه مقادیر آن ها بر مبنای فواصل متفاوت گروه بندی می شود. بخش 2.3 به بحث در مورد روش های خلاصه کردن مجموعه داده ها با استفاده از آمار می پردازد، که بر مبنای کمیت های عددی می باشند که ارزش آن ها بر مبنای داده ها تعیین می گردد. زیر شاخه 2.3.1 سه آمار را مد نظر قرار می دهد که برای نشان دادن مرکز مجموعه داده ها مورد استفاده قرار می گیرد: که شامل میانگین نمونه، میانه نمونه، و مد نمونه می باشد. زیرشاخه 2.3.2 به معرفی واریانس نمونه و ریشه دوم به نام انحراف معیار نمونه می پردازد. این آمار برای نشان دادن فاصله مقادیر در مجموعه داده مورد استفاده قرار می گیرد. زیر شاخه 2.3.3 در ارتباط با درصد نمونه ها بوده که بر مبنای آمارهایی می باشند که برای نمونه به ما می گوید، کدام مقدار داده بیش از 99 درصد از تمام داده ها می باشد. در بخش 2.4 نامعادله چبیشف را برای داده نمونه نشان می دهیم. این نامعادله، کران پایین نسبت داده را نشان می دهد که متفاوت از میانگین نمونه با بیش از 10 برابر انحراف معیار نمونه می باشد. در حالی که نابرابری چبیشف در ارتباط با تمام مجموعه داده مد نظر قرار می گیرد، ما می توانیم در شرایط خاص، که در بخش 2.5 به بحث در مورد آن پرداخته شده، برآورد دقیق تری از نسبت داده هایی که در انحراف معیار نمونه k از میانگین نمونه قرار دارد، بدست آوریم. در بخش 2.5 ما این مورد را مد نظر قرار می دهیم که زمانی که نموداری از داده ها اشکال زنگی شکل را دنبال می کند، گفته می شود که این مجموعه داده ها به صورت تقریبی نرمال بوده؛ و برآورد دقیق تری توسط قوانین تجربی داده می شود.....