Update copyright to LGPL on all files
[dyninst.git] / common / src / solarisKludges.C
1 /*
2  * Copyright (c) 1996-2009 Barton P. Miller
3  * 
4  * We provide the Paradyn Parallel Performance Tools (below
5  * described as "Paradyn") on an AS IS basis, and do not warrant its
6  * validity or performance.  We reserve the right to update, modify,
7  * or discontinue this software at any time.  We shall have no
8  * obligation to supply such updates or modifications or any other
9  * form of support to you.
10  * 
11  * By your use of Paradyn, you understand and agree that we (or any
12  * other person or entity with proprietary rights in Paradyn) are
13  * under no obligation to provide either maintenance services,
14  * update services, notices of latent defects, or correction of
15  * defects for Paradyn.
16  * 
17  * This library is free software; you can redistribute it and/or
18  * modify it under the terms of the GNU Lesser General Public
19  * License as published by the Free Software Foundation; either
20  * version 2.1 of the License, or (at your option) any later version.
21  * 
22  * This library is distributed in the hope that it will be useful,
23  * but WITHOUT ANY WARRANTY; without even the implied warranty of
24  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
25  * Lesser General Public License for more details.
26  * 
27  * You should have received a copy of the GNU Lesser General Public
28  * License along with this library; if not, write to the Free Software
29  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
30  */
31
32
33 // $Id: solarisKludges.C,v 1.8 2007/12/04 18:05:22 legendre Exp $
34
35 #include "common/h/headers.h"
36 #include "common/h/parseauxv.h"
37
38 #include <sys/auxv.h>
39
40 void * P_memcpy (void *A1, const void *A2, size_t SIZE) {
41   return (memcpy(A1, A2, SIZE));
42 }
43
44 unsigned long long PDYN_div1000(unsigned long long in) {
45    /* Divides by 1000 without an integer division instruction or library call, both of
46     * which are slow.
47     * We do only shifts, adds, and subtracts.
48     *
49     * We divide by 1000 in this way:
50     * multiply by 1/1000, or multiply by (1/1000)*2^30 and then right-shift by 30.
51     * So what is 1/1000 * 2^30?
52     * It is 1,073,742.   (actually this is rounded)
53     * So we can multiply by 1,073,742 and then right-shift by 30 (neat, eh?)
54     *
55     * Now for multiplying by 1,073,742...
56     * 1,073,742 = (1,048,576 + 16384 + 8192 + 512 + 64 + 8 + 4 + 2)
57     * or, slightly optimized:
58     * = (1,048,576 + 16384 + 8192 + 512 + 64 + 16 - 2)
59     * for a total of 8 shifts and 6 add/subs, or 14 operations.
60     *
61     */
62
63    unsigned long long temp = in << 20; // multiply by 1,048,576
64       // beware of overflow; left shift by 20 is quite a lot.
65       // If you know that the input fits in 32 bits (4 billion) then
66       // no problem.  But if it's much bigger then start worrying...
67
68    temp += in << 14; // 16384
69    temp += in << 13; // 8192
70    temp += in << 9;  // 512
71    temp += in << 6;  // 64
72    temp += in << 4;  // 16
73    temp -= in >> 2;  // 2
74
75    return (temp >> 30); // divide by 2^30
76 }
77
78 unsigned long long PDYN_divMillion(unsigned long long in) {
79    /* Divides by 1,000,000 without an integer division instruction or library call,
80     * both of which are slow.
81     * We do only shifts, adds, and subtracts.
82     *
83     * We divide by 1,000,000 in this way:
84     * multiply by 1/1,000,000, or multiply by (1/1,000,000)*2^30 and then right-shift
85     * by 30.  So what is 1/1,000,000 * 2^30?
86     * It is 1,074.   (actually this is rounded)
87     * So we can multiply by 1,074 and then right-shift by 30 (neat, eh?)
88     *
89     * Now for multiplying by 1,074
90     * 1,074 = (1024 + 32 + 16 + 2)
91     * for a total of 4 shifts and 4 add/subs, or 8 operations.
92     *
93     * Note: compare with div1000 -- it's cheaper to divide by a million than
94     *       by a thousand (!)
95     *
96     */
97
98    unsigned long long temp = in << 10; // multiply by 1024
99       // beware of overflow...if the input arg uses more than 52 bits
100       // than start worrying about whether (in << 10) plus the smaller additions
101       // we're gonna do next will fit in 64...
102
103    temp += in << 5; // 32
104    temp += in << 4; // 16
105    temp += in << 1; // 2
106
107    return (temp >> 30); // divide by 2^30
108 }
109
110 unsigned long long PDYN_mulMillion(unsigned long long in) {
111    unsigned long long result = in;
112
113    /* multiply by 125 by multiplying by 128 and subtracting 3x */
114    result = (result << 7) - result - result - result;
115
116    /* multiply by 125 again, for a total of 15625x */
117    result = (result << 7) - result - result - result;
118
119    /* multiply by 64, for a total of 1,000,000x */
120    result <<= 6;
121
122    /* cost was: 3 shifts and 6 subtracts
123     * cost of calling mul1000(mul1000()) would be: 6 shifts and 4 subtracts
124     *
125     * Another algorithm is to multiply by 2^6 and then 5^6.
126     * The former is super-cheap (one shift); the latter is more expensive.
127     * 5^6 = 15625 = 16384 - 512 - 256 + 8 + 1
128     * so multiplying by 5^6 means 4 shift operations and 4 add/sub ops
129     * so multiplying by 1000000 means 5 shift operations and 4 add/sub ops.
130     * That may or may not be cheaper than what we're doing (3 shifts; 6 subtracts);
131     * I'm not sure.  --ari
132     */
133
134    return result;
135 }
136
137 bool AuxvParser::readAuxvInfo()
138 {
139   auxv_t auxv_elm;
140
141   char buffer[32];
142   snprintf(buffer, 32, "/proc/%d/auxv", pid);
143   int auxv_fd = P_open(buffer, O_RDONLY, pid);
144
145   while(read(auxv_fd, &auxv_elm, sizeof(auxv_elm)) == sizeof(auxv_elm)) {
146     if (auxv_elm.a_type == AT_BASE) {
147       interpreter_base = (Address)auxv_elm.a_un.a_ptr;
148       P_close(auxv_fd);
149       return true;
150     }
151   }
152
153   P_close(auxv_fd);  
154   return false;
155 }