физическое мышление и уравнения лагранжа
Apr. 19th, 2016 10:42 pm(эта запись может быть интересна знающим физику и сочувствующим)
Физики думают как-то по-другому, и мне не удается проникнуть в этот загадочный мир.
Я пытаюсь немного лучше понять физику, начиная с классической механики, и начал читать (это уже вторая попытка) известный учебник Гольдштейна на английском языке. В таких случаях часто проявляется свойственный мне недостаток: излишняя дотошность и стремление понять каждый шаг и каждое утверждение. Обычно я наталкиваюсь на что-то непонятное близко к началу, и вместо того, чтобы плюнуть и пока что двигаться дальше, трачу кучу времени на бултыхание вокруг да около. Потому что упрямый, как осел. Даже смешно, как на этот раз тоже случилось по шаблону.
В первой же главе учебника сначала вкратце рассматриваются законы Ньютона, но потом автор быстро переходит к выводу из них формализма Лагранжа, точнее уравнений Эйлера-Лагранжа (я ниже приведу их форму). Вообще-то часто учебники механики, как я теперь знаю, не включают в себя этот вывод; вместо этого они начинают с вариацинного принципа наименьшего действия, как более фундаментального, и выводят уравнения Эйлера-Лагранжа из него. Так, например, в учебнике Ландау-Лифшица, и многих других. Но мне как раз понравилось, что Гольдштейн показывает эквивалентность этих двух подходов, и важные подробности - напр. то, куда деваются реакции связей и что нам дает право их игнорировать, записывая лагранжиан - понимаешь при этом куда лучше.
Если понимаешь вообще.
Потому что понять на том уровне, на котором мне хотелось, у меня все никак не получалось. Вместо того, чтобы плюнуть и читать дальше, я разозился и стал сравнивать описания этой конкретной темы в куче (под кучей я подразумеваю штук 20) разных учебников, задавать вопросы на форумах итд. Теперь, как мне кажется, я хорошо понимаю, как перейти от законов Ньютона и уравнениям Лагранжа, заодно перейдя в обобщенные координаты, совместимые с наложенными связями, и потеряв реакции связей. Но мне все равно остается непонятным мета-вопрос: почему нельзя было объяснить это понятнее? Напрашивается ответ: потому что физикам понятно именно так, как написано в их учебниках, потому что они думают по-другому; а мне, человеку с математическим складом мышления, нужно как-то стараться вписываться в то, как они думают. Но у меня не получается.
Я не буду здесь приводить весь вывод уравнений Эйлера-Лагранжа (по-русски их часто называют уравнениями Лагранжа второго рода) из второго закона Ньютона. Если есть интерес, могу об этом отдельно написать. Отмечу только одну частность: мне кажется неловким, что почти всегда в этой теме смешивают вместе переход к этим уравнениям в обобщенных координатах и использование так называемых "виртуальных перемещений" с принципом д'Аламбера, чтобы избавиться от реакций связей (англ. forces of constraint). Мне кажется, это можно сделать отдельно. Сначала перейти к уравнению в (произвольных) обобщенных координатах и с обобщенными силами:
для чего не нужно вообще рассматривать виртуальные перемещения, и это уравнение само по себе ценно, потому что обобщенные координаты часто упрощают анализ системы. А потом отдельно показать, что если есть система с голономными связями, то выбрав обобщенные координаты, которые обнуляют уравнения связей, мы можем воспользоваться виртуальной работой и принципом д'Аламбера, чтобы вычленить и выбросить из обобщенных сил
то, что приходится на долю реакций связей. Тогда в уравнении остаются только активные силы, а если они консервативны, то можно заменить их на потенциалы и перейти к единому для всей системы лагранжиану
. Мне кажется, что так объяснять было бы понятнее, но моему мнению в этом вопросе доверять совершенно нет смысла: месяц назад я все это вообще не понимал, и ни разу никому не пытался объяснить или преподать.
Однако этот педагогический вопрос меня занимает куда меньше, чем математические. Из этих последних в качестве самого яркого я напишу о так называемом "законе сокращения точек", который используется в процессе вывода уравнений Лагранжа. Если мы переходим от декартовых координат r к неким обобщенным координатам q, и у нас есть функции перехода

которые задают декартовы координаты в терминах обобщенных координат и времени (но не обобщенных скоростей!), то используя обычное правило дифференциирования сложной функции (каждая
- функция от t) мы можем записать

И тут происходит следующий замечательный трюк: говорится что-то вроде: "мы видим, что это выражение линейно от
", или "если в этом выражении взять производную по
", или просто говорится, что очевидно, что из этого выражения сразу следует "закон сокращения точек":

и вот это меня совершенно повергло в ступор. Я не мог понять, как так можно: только что
у нас была функция от времени, но сейчас мы притворяемся, будто это независимая формальная переменная, по которой мы берем производную. Как это одновременно укладывается в голове? То есть сначала я вообще долго не мог понять, как это может быть,
, но потом это у меня вроде бы устоялось: да, лагранжиан рассматривается как функция формально независимых переменных положения и переменных скорости, так что можно брать производную по скорости, она действительно переменная, а не функция времени. Но если она не функция времени, что позволяет нам написать формулу дифференциирования сложной функции? Эта формула вообще не имеет смысла, если
никак не связана с
.
Сейчас мне все это кажется простым и близким к тривиальному, потому что понятно и устоялось в голове, но я помню, как месяц назад я не мог понять. И то, что мне остается непонятным до сих пор - это почему учебники один за другим не пытались это как-то объяснить. В итоге я сложил нужное мне объяснение из нескольких сетевых учебников и конспектов курсов. Но до этого я смотрел на эту тему в русских учебниках Айзермана, Ольховского, Гантмахера и Арнольда (знаменитые "Математические методы классической механики"), и в английских учебниках Гольдштейна, Саймона, Зоммерфельда, Тейлора, Клеппнера, Хосе-Салетана и многих других... английских всех уже не помню. Ни в одном из них не было нормального с моей точки зрения объяснения того, что тут происходит на математическом уровне.
Сложилось очень четкое ощущение того, что есть особое физическое мышление, которое недоступно мне с моим математическим начетничеством, в котором это действительно нормально и не требует никаких разъяснений. У меня не получается так думать, и нет доступа в этот мир.
Меж тем объяснение, о котором я говорю, мне не кажется особо длинным или формальным. Если бы я мог послать его себе на месяц в прошлое, оно бы выглядело примерно так:
OK, это было, наверное, длинновато, мне надо учиться писать такие объяснения лаконичнее и менее дотошно. Однако если бы я месяц назад увидел что-то в этом роде, это мгновенно сняло бы все вопросы по поводу "закона сокращения точек" и вообще почти все оставшиеся сложности с этим выводом уравнений Лагранжа. Но при этом ни один учебник механики из всех, что я просмотрел, не пытается что-то подобное сказать (за исключением редких книг, которые вводят действительно математический подход, с дифференциальной геометрией и многообразиями - но это уже совсем другой уровень абстракции). Почему? Потому что это слишком математично, слишком дотошно? Наверное, потому, что у физиков есть доступ к их особому виду мышления, которое просто отвергает подобные объяснения и считает их ненужными.
Физики думают как-то по-другому, и мне не удается проникнуть в этот загадочный мир.
Я пытаюсь немного лучше понять физику, начиная с классической механики, и начал читать (это уже вторая попытка) известный учебник Гольдштейна на английском языке. В таких случаях часто проявляется свойственный мне недостаток: излишняя дотошность и стремление понять каждый шаг и каждое утверждение. Обычно я наталкиваюсь на что-то непонятное близко к началу, и вместо того, чтобы плюнуть и пока что двигаться дальше, трачу кучу времени на бултыхание вокруг да около. Потому что упрямый, как осел. Даже смешно, как на этот раз тоже случилось по шаблону.
В первой же главе учебника сначала вкратце рассматриваются законы Ньютона, но потом автор быстро переходит к выводу из них формализма Лагранжа, точнее уравнений Эйлера-Лагранжа (я ниже приведу их форму). Вообще-то часто учебники механики, как я теперь знаю, не включают в себя этот вывод; вместо этого они начинают с вариацинного принципа наименьшего действия, как более фундаментального, и выводят уравнения Эйлера-Лагранжа из него. Так, например, в учебнике Ландау-Лифшица, и многих других. Но мне как раз понравилось, что Гольдштейн показывает эквивалентность этих двух подходов, и важные подробности - напр. то, куда деваются реакции связей и что нам дает право их игнорировать, записывая лагранжиан - понимаешь при этом куда лучше.
Если понимаешь вообще.
Потому что понять на том уровне, на котором мне хотелось, у меня все никак не получалось. Вместо того, чтобы плюнуть и читать дальше, я разозился и стал сравнивать описания этой конкретной темы в куче (под кучей я подразумеваю штук 20) разных учебников, задавать вопросы на форумах итд. Теперь, как мне кажется, я хорошо понимаю, как перейти от законов Ньютона и уравнениям Лагранжа, заодно перейдя в обобщенные координаты, совместимые с наложенными связями, и потеряв реакции связей. Но мне все равно остается непонятным мета-вопрос: почему нельзя было объяснить это понятнее? Напрашивается ответ: потому что физикам понятно именно так, как написано в их учебниках, потому что они думают по-другому; а мне, человеку с математическим складом мышления, нужно как-то стараться вписываться в то, как они думают. Но у меня не получается.
Я не буду здесь приводить весь вывод уравнений Эйлера-Лагранжа (по-русски их часто называют уравнениями Лагранжа второго рода) из второго закона Ньютона. Если есть интерес, могу об этом отдельно написать. Отмечу только одну частность: мне кажется неловким, что почти всегда в этой теме смешивают вместе переход к этим уравнениям в обобщенных координатах и использование так называемых "виртуальных перемещений" с принципом д'Аламбера, чтобы избавиться от реакций связей (англ. forces of constraint). Мне кажется, это можно сделать отдельно. Сначала перейти к уравнению в (произвольных) обобщенных координатах и с обобщенными силами:
для чего не нужно вообще рассматривать виртуальные перемещения, и это уравнение само по себе ценно, потому что обобщенные координаты часто упрощают анализ системы. А потом отдельно показать, что если есть система с голономными связями, то выбрав обобщенные координаты, которые обнуляют уравнения связей, мы можем воспользоваться виртуальной работой и принципом д'Аламбера, чтобы вычленить и выбросить из обобщенных сил
Однако этот педагогический вопрос меня занимает куда меньше, чем математические. Из этих последних в качестве самого яркого я напишу о так называемом "законе сокращения точек", который используется в процессе вывода уравнений Лагранжа. Если мы переходим от декартовых координат r к неким обобщенным координатам q, и у нас есть функции перехода
которые задают декартовы координаты в терминах обобщенных координат и времени (но не обобщенных скоростей!), то используя обычное правило дифференциирования сложной функции (каждая
И тут происходит следующий замечательный трюк: говорится что-то вроде: "мы видим, что это выражение линейно от
и вот это меня совершенно повергло в ступор. Я не мог понять, как так можно: только что
Сейчас мне все это кажется простым и близким к тривиальному, потому что понятно и устоялось в голове, но я помню, как месяц назад я не мог понять. И то, что мне остается непонятным до сих пор - это почему учебники один за другим не пытались это как-то объяснить. В итоге я сложил нужное мне объяснение из нескольких сетевых учебников и конспектов курсов. Но до этого я смотрел на эту тему в русских учебниках Айзермана, Ольховского, Гантмахера и Арнольда (знаменитые "Математические методы классической механики"), и в английских учебниках Гольдштейна, Саймона, Зоммерфельда, Тейлора, Клеппнера, Хосе-Салетана и многих других... английских всех уже не помню. Ни в одном из них не было нормального с моей точки зрения объяснения того, что тут происходит на математическом уровне.
Сложилось очень четкое ощущение того, что есть особое физическое мышление, которое недоступно мне с моим математическим начетничеством, в котором это действительно нормально и не требует никаких разъяснений. У меня не получается так думать, и нет доступа в этот мир.
Меж тем объяснение, о котором я говорю, мне не кажется особо длинным или формальным. Если бы я мог послать его себе на месяц в прошлое, оно бы выглядело примерно так:
"Мы знаем, что силы зависят от мгновенных значений координат и скоростей точек, или при переходе к обобщенным координатам от мгновенных значений обобщенных координати обобщенных скоростей
. И мы ожидаем, что уравнвния движения будут дифференциальными уравнениями второго порядка, в которых положения и скорости являются начальными условиями. Поэтому удобно ввести пространство из 2n+1 измерений, в котором есть n измерений
и еще n измерений
, независимых друг от друга, а также измерение времени (такое пространство называют иногда фазовым пространством или фазовым пространством скоростей, в отличие от конфигурационного пространства, где есть одни координаты
). Чтобы понять эту независимость, бывает полезно думать о точке фазового пространства, как о наборе начальных условий для уравнений движения системы; тогда интуитивно понятно, почему координаты-скорости не зависят от координат-положений. Дополнительная координата времени оказывается нужна, если силы зависят явным образом от времени.
На этом пространстве мы рассматриваем разные функции, как например лагранжианявляется функцией на фазовом пространстве. Важно понять, что некоторые действия с этими функциями можно выполнять только после того, как задана траектория движения
, которая является кривой в конфигурационном пространстве, и одновременно определяет кривую в фазовом пространстве, потому что скорости
определяются очевидным образом как производные по времени от траектории
. Как только мы фиксируем конкретную траекторию
, она определяет скорости
, и все функции на фазовом пространстве автоматически становятся фунцкиями только от времени t. До того, как мы зафиксировали траекторию, они не являются функциями от времени. Например, посмотрим на уравнение Лагранжа:
В чем смысл этого оператора d/dt? Его смысл следующий: "если вы возьмете некую траекторию, и с ее помощью представите
как функцию от t, тогда производная этой функции минус
, тоже как функция от t, тождественно равно нулю". Уравнение Лагранжа таким образом говорит: траектория движения
должна быть такой, чтобы превратить уравнение в тождество. А оператор d/dt действует после того, как все представлено в виде функции от времени.
Обратите внимание, что для того, чтобы вычислить, нам не нужна была траектория
, но для того, чтобы вычислить
она необходима. Таким образом, если
произвольная функция на фазовом пространстве, то есть действия, которые с
можно производить "не на кривой", т.е. без траектории - вычислять ее значения, брать частные производные. А есть действия, которые производятся "на кривой": в частности, полная производная по времени
.
Но теперь рассмотрим частный случай, когда функциязависит только от координат и времени, а не скоростей - что верно, в частности, для функций перехода от декартовых координат к обобщенным:
. Тогда если мы подставим в эту фунцкию траекторию
и возьмем производную по времени, то в ней не будет вторых производных, только первые. Это дает нам право сделать следующий трюк: определить формально оператор
для таких функций "не на кривой", без траектории, через формулу:
В этой формулене является функцией, а только независимой переменной в фазовом пространстве. Это не использование теоремы о дифференциировании сложной функции, это всего лишь произвольное определение некоей операции d/dt, которая до сих пор "не на кривой" не была определена. Но очевидно при этом, что если мы потом введем траекторию
и применим ее к результату этой операции, то эффект будет ровно тот, что мы хотим. Важно понять вот что. Отношения между функциями
и
следующие. Они обе функции на фазовом пространстве, от 2n+1 переменных (хотя первая не зависит от обобщенных скоростей). В этом качестве вторая из них не является производной первой. Но вторая специально подобрана таким образом, что после выбора любой траектории
, они обе становится функциями от t, и тогда вторая становится производной первой.
Этот трюк позволяет нам применять d/dt "заранее", до введения траектории, и гарантирует нам, что постольку, поскольку в конце концов мы все будем вычислять "на кривой", результат будет тот же. Следовательно, мы можем пользоваться этой искусственной функцией, и в частности действительно тривиальным, как теперь понятно, тождеством
мы можем называть эту"скоростью точки i", можем с ее помощью определять кинетическую энергию всей системы:
и с ее помощью Лагранжиан
И все это мы можем делать, поскольку все это делается для того, чтобы в итоге задать ограничения на траекториюи все эти функции будут в конечном итоге вычисляться "на кривой"
".
OK, это было, наверное, длинновато, мне надо учиться писать такие объяснения лаконичнее и менее дотошно. Однако если бы я месяц назад увидел что-то в этом роде, это мгновенно сняло бы все вопросы по поводу "закона сокращения точек" и вообще почти все оставшиеся сложности с этим выводом уравнений Лагранжа. Но при этом ни один учебник механики из всех, что я просмотрел, не пытается что-то подобное сказать (за исключением редких книг, которые вводят действительно математический подход, с дифференциальной геометрией и многообразиями - но это уже совсем другой уровень абстракции). Почему? Потому что это слишком математично, слишком дотошно? Наверное, потому, что у физиков есть доступ к их особому виду мышления, которое просто отвергает подобные объяснения и считает их ненужными.
no subject
Date: 2016-04-19 08:15 pm (UTC)no subject
Date: 2016-04-19 08:28 pm (UTC)" Я не мог понять, как так можно: только что у нас была функция от времени, но сейчас мы притворяемся, будто это независимая формальная переменная, по которой мы берем производную. Как это одновременно укладывается в голове? То есть сначала я вообще долго не мог понять, как это может "
Я, правда, тогда так и не поняла, и просто "приняла на веру, что вот сюда надо подставлять циферки"....
Что для меня значило понимание того, что физику я таки никогда не пойму.
no subject
Date: 2016-04-19 08:39 pm (UTC)Они на этом физическом примере (который они знают лучше) изучают математический аппарат.
Ты же - наоборот, зная математический аппарат (который знаешь лучше) пытаешься приложить его к физическому примеру.
no subject
Date: 2016-04-19 08:54 pm (UTC)Про педагогический эффект не знаю, да и я давно не физик, но объяснение мне кажется действительно излишним. Кривые какие то в конфигурационном пространстве, чушь какая то, я таких словей то не знаю.
Если пофилософствовать, то множество систем которые могут существовать в нашей вселенной, да еще и подчиняться классической механике, это гораздо менее мощное множество, чем множество систем которые можно описать формализмом Лагранжа ( два шара один размером с Солнце второй размером с теннисный мячик связанные невесомым стержнем длиной в десяток парсеков).
Поэтому излишняя абстрактность вредна так как не помогает думать, ибо часто требует рассмотрения вариантов которые в физической вселенной не встречаются. Абстракция полезна например если она сокращает количество сущностей, если она увеличивает количество сущностей, то скорее всего это хреновая абстракция.
Гораздо важнее "интуиция", натасканность нейронных сетей в головах физиках на часто встречающиеся примеры. Да эти нейронные сети переобучены и скорее всего лажали бы на примерах за пределами возможностей физической вселенной, но таких примеров по очевидным причинам нет.
no subject
Date: 2016-04-19 09:12 pm (UTC)... часто проявляется свойственный мне недостаток: излишняя дотошность и стремление понять каждый шаг и каждое утверждение. Обычно я наталкиваюсь на что-то непонятное близко к началу, и вместо того, чтобы плюнуть и пока что двигаться дальше, трачу кучу времени на бултыхание вокруг да около.
Ты влез мне в мозги!
no subject
Date: 2016-04-19 09:29 pm (UTC)no subject
Date: 2016-04-19 09:55 pm (UTC)Но хочу сказать, что Вас и Ваших постов очень не хватало в ЖЖ. Это лучший пост за многие месяцы, что видел в ленте, в общем.
no subject
Date: 2016-04-20 04:04 pm (UTC)no subject
Date: 2016-04-19 09:59 pm (UTC)Эта зависимость описывает просто какую-то дополнительную поверхность, которая может дать еще какие-то уравнения, но для того, чтобы было верно равенство про частные производные разве "независимость" нужна?
no subject
Date: 2016-04-19 10:18 pm (UTC)z = ax + by + ct (где t -- как бы время, а x, y и z -- координаты трехмерные).
Тут понятно, чему равны частные производные z по x и y. А теперь вы говорите: "Но это же не произвольные x и y, x и y -- это функции от t!" Ну и что, собственно? Равенство dz = adx + bdy + cdt будет по-прежнему верно, потому что оно просто верно, независимо от того, что его "пересекли" какой-то поверхностью/кривой.
no subject
Date: 2016-04-19 10:05 pm (UTC)В конце концов, развернутые объяснения, которые так любят математики, служат как бы мостиком от той точки, где находится учащийся, в ту, куда преподаватель хочет его привести. Физики, наверное, считают, что такие подпорки только мешают быстро научиться свободно плавать.
Отсюда характерное (для меня -- не знаю, как для других) ощущение при чтении учебников по околофизическим дисциплинам и слушании докладов в физическом стиле: поначалу как будто понятно, потому что догадываешься, что мог иметь в виду автор, но потом сумма таких догадок растет, в каждой из них я не вполне уверен, они забываются, я в них путаюсь и теряю нить (окончательно переставая понимать, какие переменные являются функциями каких и т.п.) С точки зрения физиков, это, наверное, означает, что я зря пытаюсь выстроить у себя в голове логическую картину их предмета, вместо того, чтобы оттолкнуться от суши и плыть по волнам.
no subject
Date: 2016-04-20 11:08 pm (UTC)ДА!
no subject
Date: 2016-04-19 10:53 pm (UTC)И, если серьезно, это в самом деле куда ближе к правде. Физического мышления тут очень немного, используемые трюки - просто общеизвестные (в соответствующих кругах) утверждения, на которые можно ссылаться без расшифровки.
no subject
Date: 2016-04-19 11:07 pm (UTC)Интересно, что вы стали смотреть в 20 разных учебников, вместо того, чтобы разобрать несколько примеров.
no subject
Date: 2016-04-20 12:07 am (UTC)В 3-м английском издании Голдштейна в формуле (1.46) "v" определяется просто через производную сложной функции. Далее, так как рассматривается частная производная, а не полная, нам не важно, как "q с точкой" зависит от q, t и любых других переменных, мы можем рассматривать ее как независимую переменную именно потому, что речь идет о частной производной. Поэтому взяв частную производную формулы (1.46) по "q с точкой"_j получаем, что от суммы остается только то слагаемое, в котором k=j. Причем, в силу линейности, при дифференцировании остается только коэффициент, равный как раз частной производной r по q_k=q_j. Последнее же слагаемое при дифференцировании дает, очевидно 0.
В общем, мне кажется, самое важное это понять, что пока речь идет о частных производных, любая буква, грубо говоря, может быть независимой переменной. И лично меня больше удивляло именно то, что этот аппарат позволяет считать обобщенные координаты и скорости независимыми с физической точки зрения, несмотря на то, что в Ньютоновском подходе они были неотделимы.
no subject
Date: 2016-04-20 04:20 pm (UTC)При чем здесь то, что это частная производная? Может, я чего-то очевидного не понимаю, но все-таки та строгость, которую вы видите, ускользает от меня. Вы соглашаетесь, что в (1.46) скорость определяется как производная сложной функции. "Сложная функция" здесь означает, что r функция от (q,q',t), а q,q' - функции от t. Хорошо, мы применили формулу производной сложной функции и получили, точно по формуле, функцию от t. Что дальше с ней делать? Как брать ее производную по q или q', если нам это нужно? Это же функция от t; говоря строгим математическим языком, набор пар чисел (аргумент t, значение v). Что вы с этим набором пар собираетесь делать?
Я вижу неустраняемую нестрогость тут в том, что Гольдштейн (и вы вслед за ним) хочет одновременно смотреть на v как на функцию от t в математическом смысле (потому что таким образом он оправдывает применение chain rule), и одновременно как некоторый symbolic expression (1.46), в котором "понятна" его линейная зависимость от написанного в нем символа q', например. Но извините, chain rule не дает на выходе символическое выражение, написанное на бумаге. Chain rule дает функцию от аргумента, по которому берется производная. Оно не дает функцию от промежуточных аргументов. Для того, чтобы отнестись к результату chain rule как к функции промежуточных аргументов, и сделать это математически строго, вам нужно: а) множество, на котором эта функция определена - т.е. фазовое пространство; б) определение этой функции - т.е. (1.46), интерпретируемое как ОПРЕДЕЛЕНИЕ, а не примемение chain rule. Именно этот путь я избрал в своем "объяснении". Тогда у вас есть действительно v как функция от q,q',t, и вы имеете полное строгое правое варьировать ее аргумент q' независимо от других аргументов и вычислять напр. частную производную.
(no subject)
From:(no subject)
From:no subject
Date: 2016-04-20 02:10 am (UTC)no subject
Date: 2016-04-20 03:24 am (UTC)1) Учил это давно, других этому пока не учил, детали подзабылись.
2) Вашу запись до конца не дочитал.
Из второго дисклаймера вытекает мой ответ на ваш вопрос. При том, что эта ваша запись должна, по идее, быть мне очень интересна, одолеть я её сразу не могу по одной причине (требующей два слова для описания): длинно и скучно.
Я помню трудности с "...но сейчас мы притворяемся, будто это независимая формальная переменная, по которой мы берем производную", и помню что врубиться получилось не сразу. Но метод "врубления" был совершенно не такой как у вас. "Врубляться" вашим методом мне кажется непродуктивно.
Как я врублялся? Во-первых, я это делал в undergrad (не на Гольдштейне). Научился использовать уравнения Лагранжа: взял задачник, прорешал дюжину примеров. Это было очень полезно и интересно: соображать, какие обобщенные координаты надо выбрать, чтобы задача стала тривиальной.
В процессе решения стало понятно, что значит, что скорости -- независимые от положений переменные. Парочка проверок это подтверждает (ну, там, четные от времени функции выразимы только косинусами, а их скорости - наоборот).
После этого прошел через вывод уравнений, используя парочку решенных примеров. Так все видно.
По моему такой метод гораздо продуктивнее. В конце концов все эти выводы -- не вещь в себе. Они нужны чтобы реальный мир понимать.
no subject
Date: 2016-04-20 04:38 am (UTC)А вот почему книги и статьи пишут так, что их очень сложно читать вне курса, который ведёт человек, который уже всё понял, я не знаю. Но это общее место и в математике, и в физике. В новой области вечно нихрена непонятно без “устной торы”, которую на любом семинаре первым же делом объясняют, а в книжке вообще не.
no subject
Date: 2016-04-20 05:46 am (UTC)Есть также цѣлый рядъ физическихъ теорiй, гдѣ математическiя детали опредѣленiй нѣкоторыхъ основныхъ величинъ пока что неизвѣстны, и поэтому эти теорiи пока что вообще нельзя сформулировать строго. Къ этимъ теорiямъ относятся, какъ минимумъ, КТП и статистическая механика.
Многiе здѣсь написали, что "послѣ проработки 10 примѣровъ все стало понятно". Позволю себѣ не согласиться - я тоже прошелъ черезъ это. Не стало ничего понятно, но просто стало привычно, и затвердилось, что вотъ здѣсь мы при вычисленiяхъ дѣлаемъ так-то и получаются правильные результаты. Послѣ этого, если дѣлать такiя вычисленiя много лѣтъ, сами собою заднимъ числомъ придумываются какiя-то объясненiя, которыя на самомъ дѣлѣ не являются математически строгимъ пониманiемъ, но достаточно забалтываютъ совѣсть. Большинство учебниковъ по физикѣ представляютъ собой наполовину именно такiя псевдо-объясненiя, забалтывающiя студента. У студента возникаетъ устойчивый комплексъ - никакихъ вопросовъ не задавать, смирно сидѣть, всѣ задачи рѣшать.
Есть и другая сторона вопроса. Часто для настоящаго пониманiя того, почему можно "сократить точки", требуется болѣе абстрактная математика, чѣмъ для "забалтыванiя". Физики традицiонно избѣгаютъ абстрактной математики.
Вотъ еще нѣсколько вопросовъ, гдѣ въ физическихъ книгахъ вы не найдете толковыхъ объясненiй.
Неголономныя системы: что такое "энергiя ускоренiй" и какъ выводить уравненiя движенiя. (Этого, кстати, вообще нѣтъ у Ландау-Лифшица.)
Какова роль принципа Даламбера въ выводѣ уравненiй Лагранжа, и что это такое за таинственныя "виртуальныя перемѣщенiя".
Что такое статистическая энтропiя и почему она "растетъ съ большой вѣроятностью".
Изъ "Квантовой механики" Ландау-Лифшица невозможно вообще понять, что такое спинъ электрона и что такое "матрица плотности". Практически невозможно понять, что такое "S-матрица" въ квантовой теорiи разсѣянiя.
Почему уравненiе Дирака является Лоренцъ-инварiантнымъ, хотя содержитъ гамма-матрицы, составленныя изъ постоянныхъ чиселъ. (Т.е. почему гамма-матрица можетъ иметь лоренцевый индексъ. Вѣдь, напримѣръ, не можетъ быть лоренцеваго вектора, составленнаго изъ постоянныхъ чиселъ (1,1,1,1) - компоненты вектора обязаны преобразовываться по Лоренцу. )
Почему вообще можно использовать уравненiе Дирака для расчетовъ движенiя электрона въ атомѣ, какъ если бы оно являлось релятивистскимъ уравненiемъ Шредингера, когда оно явно не является таковымъ (т.к. оно не можетъ имѣть вѣроятностной интерпретацiи, которую бы имѣло уравненiе Шредингера съ релятивистскимъ гамильтонiаномъ).
Какъ работаетъ эффектъ Казимира.
Что такое "вторичное квантованiе" и почему вообще его можно дѣлать.
Что такое "перенормировка" въ КТП.
no subject
Date: 2016-04-20 01:33 pm (UTC)>Какова роль принципа Даламбера въ выводѣ уравненiй Лагранжа, и что это такое за таинственныя "виртуальныя перемѣщенiя".
Насчет этого я тоже уже убедился, что очень трудно с толковыми объяснениями, и такое впечатление, что все хотят сказать пару слов о "виртуальных перемещениях" и тут же забыть о них навсегда. Особенно непонятной оказалась для меня лично универсально используемая фраза "... перемещения, консистентные с наложенными связями", которую я наивно интерпретировал следующим неверным образом: что после сдвига координат на эти смещения они продолжают выполнять уравнения связей. Когда я собственно попытался проверить, что в простенькой задаче действительно выполняется принцип д'Аламбера и реакции связей можно игнорировать, я зашел в тупик. К счастью, вышел из него сам (и ответил на свой же вопрос).
(no subject)
From:(no subject)
From:no subject
Date: 2016-04-20 06:07 am (UTC)А можно прочесть про распределение Картана, гарантирующее, что "производная окажется скоростью", касательное и кокасательное расслоение и т.д.
Вот очень подробное и очень детальное изложение Годбийона: http://www.twirpx.com/file/1850132/
А короче и ярче всё описано у Арнольда, в "Математических методах классической механики". Но там много оставлено для самостоятельного додумывания. Собственно, ключевые для понимания лагранжевой и гамильтоновой механики понятия дифференциальных форм и внешней производной до сих пор рекомендуется учить по Арнольду.
Что же до "вывода" уравнений Лагранжа из уравнений Ньютона, то я не понял, в каком направлении этот вывод должен происходить. Уравнения Лагранжа - гораздо более общие, и то, что в "ньютоновых" задачах из принципа наименьшего действия следуют уравнения Ньютона, - это простое наблюдение. А в сложных случаях (голономных неавтономных, или вообще неголономных), где "силы" - непонятно что, именно лагранжево описание является первичным. И этот же подход действует в теории поля, - как только физик из каких-то соображения выписывает лагранжиан (ну, или его "плотность", если в дифференциальной форме), - считается, что задача определена.
Одна из причин психологических трудностей, как объяснял где-то сам Арнольд, - двусмысленность обозначения частных производных. Выражение \partial L/\partial x зависит не только от того, какая переменная обозначена буквой икс, но и от того, какая переменная обозначена (не написанной явно) буквой игрек.
no subject
Date: 2016-04-20 09:11 am (UTC)Спасибо за ссылку на книгу, обязательно посмотрю (про распределение Картана ничего не знаю). Я собирался в принципе почитать изложение механики на нормальном уровне дифф. геометрии, но не сейчас, а после того, как (hopefully) пройду чисто физический учебник и немного приобрету физического понимания. Из тех, что я смотрел, мне понравились "Foundations of Mechanics" by Abraham & Marsden.
Краткое содержание предыдущих серий
From:Добавление
From:Re: Добавление
From:(no subject)
From:(no subject)
From: (Anonymous) - Date: 2016-04-24 09:37 pm (UTC) - Expandno subject
Date: 2016-04-20 06:19 am (UTC)А математики по определению все теоретики.)
no subject
Date: 2016-04-20 07:08 am (UTC)Интересно, кстати, как Хофштадтер-отец (экспериментатор, согласно Википедии) относился к таким "быстрым переходам"...
no subject
Date: 2016-04-20 07:58 am (UTC)По-моему в новых координатах кинетическая энергия запишется по-другому. Кинетическая энергия задает Риманову метрику на конфигурационном пространстве (или наоборот; см. "натуральная Лагранжева система", Арнольд, Мат Методы Механики, 4 Б). В стандартном 3N мерном пространстве Ньютоновой механики и метрика стандартная плоская (если масса каждой частицы 1, инче метрика в 3х направлениях связаных с этой частицей растягивается на корень из массы; это компенсируется записью энергии как (половины) "суммы квадратов помноженых на массы"). Если координаты обобщенные (а в случае с голономными ограничениями, то и вообще координаты на подмногообразии) то и метрика в них (соотв. ограничение метрики на подмногообразие) тоже запишется по-другому (см. примеры далее у Арнольда).
no subject
Date: 2016-04-20 07:58 am (UTC)Необходимо различать преобразования координат и движение тела.
Преобразования координат возникают, когда мы переходим из одной системы координат в другую, которая обычно движется относительно первой. Например, одна декартовая система координат поворачивается относительно другой декартовой системы координат. В математике обычно ограничиваются поворотом на заданный угол А, в то время как в физике такой поворот происходит непрерывно - с течением времени, так что угол А = А(t). В результате новые координаты зависят как от старых координат, так и от времени:
X = x*cos[A(t)] + y*sin[A(t)]
Y = -x*sin[A(t)] + y*cos[A(t)]
или
X = X(x, y, t)
Y = Y(x, y, t)
Движение тела существует независимо от преобразований системы координат, и оно происходит в любой системе координат.
Для того, чтобы описать движение тела надо
1) задать систему координат
2) задать закон движения тела в заданной системе координат.
Иногда возникает необходимость перевести уравнение движения тела из одной системы координат в другую систему координат. Это обычно обуславливается сображениями удобства. Например, равномерное движение тела по окруженности можно описать в декартовой системе координат как
X = R*cos(wt)
Y = R*sin(wt)
То же движение тела в полярной системе координат можно записать как
A = wt
что гораздо проще.
Уравнение
описывает преобразование координат, а не закон движения тела. Поскольку преобразования координат, вообще говоря, никак не связаны с законами движения, то рассуждения про то, что уравнения Ньютона (или Лагранжа) включают первые или вторые производные координат по времени, вообще говоря, иррелевантны. Закон преобразования координат выбираем мы сами (хотя это, обычно, и диктуется симметрией задачи), и обычно он имеет именно такой вид: ri = ri(q1, ..., qn, t). Очевидно, скоростей тут нет, как в примере с двумя декартовыми системами координат, одна из которых непрерывно вращается относительно другой.
В новой системе координат нам необходимо знать и скорости частиц, поскольку законы движения говорят нам, что это важно. Эти скорости обпределяются стандартным способом, через производную сложной функции:
Из Ваших рассуждений не совсем ясно, для чего именно понадобилось брать частную производную скорости по скорости. Но в любом случае, уравнение
вытекает естественным образом из предыдущих рассуждений. Достаточно вспомнить, что тут мы рассматриваем как связаны скорости тела в двух различных системах координат, которые движутся друг относительно друга по заданному закону. Это движение систем координат никак не обусловлено законами движения тела, поэтому нам нет необходимости думать о том, как именно скорость тела зависит от времени. Важно только то, как скорость тела в одной системе координат зависит от скорости тела в другой системе координат. А эта зависимость, очевидно, линейная, причём каждая компонента (старой) скорости является независимой переменной. Примерно так же, как при вращении декартовой системы координат обе (старые) координаты x и y являются независимыми переменными, наряду со временем t.
Рассуждения про то, что мы "как бы определяем" полную производную по времени тут неверны - мы не допускаем тут никакого волюнтаризма. А рассуждения про 2n+1-мерное фазовое пространство, кажется, нерелеванты.
Собственно, во всём этом нет какой-то особой "физической" логики. Достаточно понять, что для описания движения тела необходимо два элемента: система координат и закон движения, а не только закон движения.
no subject
Date: 2016-04-20 08:18 am (UTC)В частности, физики привычны к мысли что законы физики не выводятся, а формулируются. Поэтому даже когда речь идет не о новом законе, а другой формулировке, как с Лагранжевой механикой, у них не свербит в заду что ее надо вывести. Надо поискать физика который когда либо выводил уровнения Эйлера-Лагранжа для механической системы из уравненой Ньютона в общем виде. Подозреваю и Эйлер с Лагранжем этого не делали - они решили конкретную проблему, и на основании ее сформулировали общий принцип.
Установление детальных формальных связей между различными формулировками/теориями, в физике всегда послесловие, то что делается задним числом.
no subject
Date: 2016-04-20 08:33 am (UTC)no subject
Date: 2016-04-20 08:47 am (UTC)(no subject)
From:no subject
Date: 2016-04-20 09:29 am (UTC)no subject
Date: 2016-04-20 01:35 pm (UTC)(no subject)
From:Можно, я?
From:Re: Можно, я?
From:Тонкости
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From: (Anonymous) - Date: 2016-04-21 01:01 pm (UTC) - ExpandНапример
From:Re: Например
From: (Anonymous) - Date: 2016-04-21 01:49 pm (UTC) - ExpandФурье и Лежандр -- близнецы-братья
From:(no subject)
From:(no subject)
From:no subject
Date: 2016-04-20 10:49 am (UTC)