avva: (Default)
[personal profile] avva

Пишу на ассемблере! Просто чуть ли не "бойцы вспоминают минувшие дни".


       .text
.globl readcounter
readcounter:
        pushl   %ebx
        pushl   %ecx
        subl    %eax, %eax
        cpuid
        rdtsc
        pushl   %eax
        pushl   %edx
        subl    %eax, %eax
        cpuid
        popl    %edx
        popl    %eax
        popl    %ecx
        popl    %ebx
        ret
        .size   readcounter, .-counter

Date: 2007-02-13 03:12 pm (UTC)
From: [identity profile] alta-voce.livejournal.com
В минувшие дни какой-то не такой ассемблер был.

Date: 2007-02-13 03:12 pm (UTC)
From: [identity profile] avva.livejournal.com
Что да то да :(

Date: 2007-02-13 03:19 pm (UTC)
From: [identity profile] alta-voce.livejournal.com
Почему грустный смайлик?

Тот самый классический ассемблер я ненавидела, а другой известный тебе бывший программер очень даже любил.

Date: 2007-02-13 03:19 pm (UTC)
From: [identity profile] slobin.livejournal.com
А я так и не выучил ассемблера защищённого режима. На реалмодовом 8086 писал довольно много. До этого на PDP-11 и совсем немножко на 360 и 8080.

... Эстетически мотивированное любопытство ...

Date: 2007-02-13 03:22 pm (UTC)
From: [identity profile] avva.livejournal.com
Намного проще, чем реалмод, надо сказать :) после того, как привыкнешь.

Date: 2007-02-13 03:30 pm (UTC)
From: [identity profile] slobin.livejournal.com
Легко верю. Понимаете, реалмодовый я выучил спьяну. ;-) Нет, не бухой в зюзю, но после пятидесяти грамм водки. Просто после красивого и логичного PDP я откровенно боялся в ЭТО залезать, а так стало море по колено.

... She sells the seashells on the seashore ...

Date: 2007-02-13 03:23 pm (UTC)
From: [identity profile] vacuite.livejournal.com
юзай насм, там интеловская семантика

Date: 2007-02-13 03:27 pm (UTC)
From: [identity profile] avva.livejournal.com
спасибо, мне своей головной боли хватает.

subl %eax, %eax

Date: 2007-02-13 03:29 pm (UTC)
From: [identity profile] aburachil.livejournal.com
Это означает eax:=0 ? В наше время гламурнее было писать для этого "xor a" ;-)

Re: subl %eax, %eax

Date: 2007-02-13 03:33 pm (UTC)
From: [identity profile] avva.livejournal.com
Да, но sub готичнее, ведь он включает в себя глубокую мысль: "ибо прах ты и в прах возвратишься" (Бытие 3:19), а xor это что - так фигня какая-то побитовая.

глубокую мысль

Date: 2007-02-13 03:54 pm (UTC)
From: [identity profile] aburachil.livejournal.com
ash to ash
bash to bash

Re: subl %eax, %eax

Date: 2007-02-13 04:30 pm (UTC)
From: [identity profile] nice-beaver.livejournal.com
Ксор быстрее (во всяком случае, раньше был)

Re: subl %eax, %eax

Date: 2007-02-18 11:15 pm (UTC)
From: [identity profile] comnimh.livejournal.com
Короче. И сейчас короче.

Re: subl %eax, %eax

Date: 2007-02-13 05:07 pm (UTC)
From: [identity profile] potan.livejournal.com
У меня даже была гипотеза, что xor жрет меньше энергии, чем sub :-)

Date: 2007-02-14 05:22 am (UTC)
From: [identity profile] ygam.livejournal.com
Энергию жрет стирание информации, а не вычисления.

Date: 2007-02-14 08:19 am (UTC)
From: [identity profile] potan.livejournal.com
Это все философия.
Реально жрет энергию текущий по проводам ток и перезаряд емкостей.
В реализации вычитания проводов заметно больше, чем в реализации побитовых операций.

Date: 2007-02-16 12:17 am (UTC)
From: [identity profile] ygam.livejournal.com
Я пошутил.

offtopic

Date: 2007-02-13 03:47 pm (UTC)
From: [identity profile] nagunak.livejournal.com
http://soamo.livejournal.com/2541619.html

Date: 2007-02-13 03:49 pm (UTC)
From: [identity profile] avva.livejournal.com
Знаю, спасибо :)

Date: 2007-02-13 08:04 pm (UTC)
From: [identity profile] centralasian.livejournal.com
это на самом деле мне юзерпик. он же нарисовал верблюда.

Date: 2007-02-13 08:06 pm (UTC)
From: [identity profile] avva.livejournal.com
Бери, если Соамо разрешит и ты хочешь. Мне он не очень понравился, увы (хотя вообще очень люблю его стиль).

Date: 2007-02-13 08:27 pm (UTC)
From: [identity profile] centralasian.livejournal.com
а я ему там и намекнул, мол, можно ли менору на тюбетейку махнуть
(deleted comment)

Date: 2007-02-13 03:50 pm (UTC)
From: [identity profile] avva.livejournal.com
Это AT&T синтаксис, его понимает gcc.

Мне вот интересно,

Date: 2007-02-13 05:22 pm (UTC)
From: (Anonymous)
а вот 64-разрядные регистры как сейчас называются? Особенно как выглядит программа для интелей (пусть и дуо).

Date: 2007-02-13 05:30 pm (UTC)
From: [identity profile] avva.livejournal.com
rax, rcx, rdx, rbx, rsp, rbp, rsi, rdi, r8, r9, r10, r11, r12, r13, r14, and r15.

В общем, как обычно выглядит. eax это нижняя половина rax итд.
Основные инструкции те же.

Date: 2007-02-13 04:00 pm (UTC)
From: [identity profile] iratus.livejournal.com
ну функция возвращает cpuid или артачится :)))

Date: 2007-02-13 05:09 pm (UTC)
From: [identity profile] avva.livejournal.com
вовсе нет :)

Date: 2007-02-13 05:42 pm (UTC)
From: [identity profile] unbe.livejournal.com
А зачем второй cpuid?

Date: 2007-02-13 05:50 pm (UTC)
From: [identity profile] avva.livejournal.com
А зачем первый? Затем же.

Date: 2007-02-13 06:15 pm (UTC)
From: [identity profile] unbe.livejournal.com
Это первое упоминание о втором cpuid, которое я увидел. Везде пишут, что надо только до. Зачем чистить OOO pipeline после?

Date: 2007-02-13 06:27 pm (UTC)
From: [identity profile] avva.livejournal.com
Потому что "нечестно", ведь сразу после первого запускается pipeline опять, и во время самого замера уже плетет свои гнусные сети со следующими инструкциями. Самое чистое решение - оборвать точку замера с двух сторон. Это даст самую чистую картину поведения. Конечно, с прагматической точки зрения второй обрыв далеко не так важен, как первый, это верно - что оно там успеет сделать, практически ничего.
Но как-то симметричнее и последовательнее так, по-моему. А что касается самих затрат, я все равно буду учитывать (примерные) затраты на cpuid при калибровке результатов, так какая уж разница, один раз или два.

Date: 2007-02-13 07:08 pm (UTC)
From: [identity profile] unbe.livejournal.com
Я, конечно, не знаю, что именно и как нужно измерить, но мне кажется, второй cpuid сделает только хуже. Он не повлияет на численный результат (в eax:edx то же значение, что и было бы без него), а даст, по сути, только задержку уже после измерения, причем не постоянную, а плавающую. Где смысл? :)

Date: 2007-02-13 08:01 pm (UTC)
From: [identity profile] avva.livejournal.com
Идея в том, что результат тот же, но если вы после этого повторяете тот же процесс (который изначально замеряли), или еще что-нибудь, что хотите измерить, то разница между следующим значением и этим будет немножко нечестная, потому что CPU начал загружать все в pipelines, prefetch queues итд. итп. еще до того, как закончилась операция rdtsc. Ваше следующее измерение будет чуть меньше реального; подобно тому, как если бы вы не делали первый cpuid, это измерение могло быть меньше реального.

Date: 2007-02-13 08:54 pm (UTC)
From: [identity profile] unbe.livejournal.com
Я понял, просто не согласен. OOO execution - это нормальный режим работы, и именно в нем получается "реальный" результат. После cpuid часть кода будет выполнена в ненормальных условиях, то есть, потенциально, с другой скоростью. Эта часть может быть из двух кусков - тот, что внутри readcounter, и тот, что снаружи. Первый можно попытаться скомпенсировать при расчетах, второй нельзя. Еще один cpuid просто удлинняет этот второй кусок, делая измерение менее точным.

Проще говоря, если даже в случае без 2го cpuid будет какое-то "убыстрение" (хотя неясно, относительно чего), то в случае с ним будем замедление, которое гораздо труднее учесть.

Против "подобно тому...": первый cpuid делается только чтобы избежать OOO исполнения самого rdtsc. OOO исполнения чего нужно избежать после rdtsc?

Извините, что так длинно :)

Date: 2007-02-18 11:28 pm (UTC)
From: [identity profile] avva.livejournal.com
Совершенно не надо извиняться. На самом деле спасибо, вы меня убедили :) уберу второй cpuid.

Date: 2007-02-14 02:11 am (UTC)
From: [identity profile] malaya-zemlya.livejournal.com
Во-первых, RDTSC синхронизирует pipeline.
Во-вторых, задержка у него самого меняется 90 до 120 циклов в зависимости от знака зодиака и погоды на Марсе, так что абсолютной точности не добиться.

http://softwarecommunity.intel.com/ISN/Community/en-US/forums/thread/30226599.aspx

Date: 2007-02-14 03:26 am (UTC)
From: [identity profile] shamany.livejournal.com
она вообще была недокументированной долго. а то, что задержка меняется, конечно, она же от конвейера зависит практически напрямую!

Date: 2007-02-14 05:02 am (UTC)
From: [identity profile] malaya-zemlya.livejournal.com
Я имел ввиду, что второй CPUID тут мало что может поменять.

Date: 2007-02-18 11:29 pm (UTC)
From: [identity profile] avva.livejournal.com
Да, убедили :) эх, симметричнее было!

Date: 2007-02-13 05:48 pm (UTC)
From: [identity profile] madfire.livejournal.com
at&t синтаксис придумали нечеловеки..

Date: 2007-02-13 05:50 pm (UTC)
From: [identity profile] avva.livejournal.com
Да :( никогда не привыкну, изверги.

Date: 2007-02-13 06:04 pm (UTC)
From: [identity profile] djuffin.livejournal.com
Все у AT&T по-другому. То два плюсика к C дорисуют, то проценты к регистрам.

Date: 2007-02-13 10:56 pm (UTC)
From: [identity profile] faceted-jacinth.livejournal.com
О, я правильно понял, что делает этот код.

Разные Люди советуют всё-таки использовать АПИ (под виндой - QueryPerformanceFrequency/QueryPerformanceCounter), которые вешаются на какой-то другой счётчик, насколько я понял, потому что Есть Нюансы. Оно, конечно, гораздо тормознее (когда я мерял, вызов QueryPerformanceCounter занимал несколько тысяч тактов), но его ж и не нужно часто вызывать.

Из нюансов -- проблемы на многопроцессорных системах (рекомендуется выставлять аффинити тому треду, которому нужно это всё мерять и раздавать окружающим) и на некоторых мобильных процессорах, которые самопроизвольно роняют тактовую частоту при высоком айдл тайме.

Date: 2007-02-18 11:28 pm (UTC)
From: [identity profile] avva.livejournal.com
С мобильными процессорами я сам убедился забавным образом - чтобы проверить таймер, обернул им вызов сначала sleep(1), а потом usleep(1). Сон длиной в одну микросекунду дал правильную тактовую частоту процессора, а длиной в секунду - в три раза меньше, совершенно последовательно.

И про многопроцессоры понимаю. И про другие счетчики знаю, но спасибо все равно :) (но я в основном на линуксе запускать буду. но там тоже есть). Я в основном для самоудовлетворения, плюс все-таки для некоторых конкретных целей (сравнения нескольких разных алгоритмов на многих наборах исходных данных, причем алгоритмы бегут быстро, на однопроцессорной машине и в среднем намного быстрее, чем может переключиться контекст на другой тред - а такие редкие исключения можно убрать усреднением по медиане нескольких результатов; и все это для улучшения своего собственного понимания) хорошо подходит.

Date: 2007-02-14 05:20 am (UTC)
From: [identity profile] ygam.livejournal.com
Кстати, ты написал memcached? Возможно, его будут использовать в Амазоне.

Date: 2007-02-18 11:23 pm (UTC)
From: [identity profile] avva.livejournal.com
Я написал. Если можешь рассказать подробнее, расскажи (можно письмом), любопытно. Если нет - тоже нормально. Последние 2 года я почти не занимался его развитием, хотя возможно вернусь к этому, если будет время.

Date: 2007-02-19 01:16 am (UTC)
From: [identity profile] ygam.livejournal.com
Я просто подписан на внутреннюю рассылку caching-interest, и там обсуждаются сравнительные преимущества и недостатки одного inhouse пакета и memcached.

February 2026

S M T W T F S
1 2 3 4 5 67
8 9 10111213 14
15 16 17 18192021
2223 24 25262728

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Feb. 25th, 2026 02:30 pm
Powered by Dreamwidth Studios